メインコンテンツ

MATLAB ジョブ スケジューラ クラスターにおける通信の問題の解決

問題

機能的なクラスターのセットアップを維持するために、MATLAB® ジョブ スケジューラのジョブ マネージャーは MATLAB ワーカー ノードが公開しているホスト名を解決する必要があります。同様に、すべての MATLAB ワーカーおよびクライアントはジョブ マネージャー ノードが公開しているホスト名を解決しなければなりません。

ワーカーがジョブ マネージャーに接続できない場合、またはクライアント セッションがそのスケジューラを使用するプロファイルを検証できない場合、クラスター ノード間に通信の問題があることを示しています。

考えられる解決策

コマンド ライン インターフェイスを使用した調査

すべてのノードで、それぞれの IP アドレスの解決結果が一致していることを確認してください。ノードのホスト名が、そのノード自身から見た場合と他のノードから見た場合の両方で一致していることを確認します。たとえば、nodeB 上のプロセスが nodeA 上のプロセスに接続できない場合、nodeA のホスト名をローカルと nodeB の両方から確認します。それらのホスト名が一致している必要があります。

ノードが相互を識別できる場合、それらのプロセス間の問題を nodestatus コマンドを使用して診断できます。このコマンドを使用して、ローカル ホスト上で実行されている MATLAB Parallel Server™ プロセスを判別し、リモート ホストからアクセス可能なものを特定します。

たとえば、nodeA 上のワーカーが nodeB 上のジョブ マネージャーに登録できない場合、両方のノードで同じ nodestatus コマンドを実行して、nodeAnodeB とそのすべての MATLAB Parallel Server プロセスを正しく識別できることを確認します。nodeB で、Linux® または Windows® のコマンド ウィンドウから次のコマンドを実行します。matlabroot は MATLAB のインストール フォルダーです。

cd matlabroot\toolbox\parallel\bin
nodestatus -remotehost nodeB
次に、nodeA で同じコマンドを実行します。
cd matlabroot\toolbox\parallel\bin
nodestatus -remotehost nodeB
2 組のコマンドの出力が一致し、同じジョブ マネージャーとワーカーがリストされている必要があります。出力が一致しない場合は、情報レベルを高くして hostAnodestatus コマンドを再度実行し、nodeB で実行中のプロセスに関する nodeA の視点からの詳細情報を取得します。
nodestatus -remotehost nodeB -infolevel 3

管理センター ツールを使用した調査

管理センター ツールを使用していくつかの通信の問題を診断できます。管理センター ツールの詳細については、管理センターの起動を参照してください。

ノードを管理センターのリストにホスト名を指定して追加できない場合は、代わりに IP アドレスを使用できます。詳細については、ホストの追加を参照してください。

MATLAB ジョブ スケジューラ ノード、ワーカー ノード、および管理センターが稼動しているノードの間の通信をテストするには、管理センター ツールで [接続のテスト] を選択して [接続テスト] ダイアログ ボックスを開きます。それらのテストにより、ノードが相互を識別でき、ノードのプロセス間で通信できることが検証されます。いずれかの通信テストに失敗すると、問題の診断に使用できる情報が管理センターから提供されます。詳細については、管理センターでの MATLAB ジョブ スケジューラ クラスターの接続テストを参照してください。

参考

トピック