MATLAB ジョブ スケジューラ クラスターにおける通信の問題の解決
問題
機能的なクラスターのセットアップを維持するために、MATLAB® ジョブ スケジューラのジョブ マネージャーは MATLAB ワーカー ノードが公開しているホスト名を解決する必要があります。同様に、すべての MATLAB ワーカーおよびクライアントはジョブ マネージャー ノードが公開しているホスト名を解決しなければなりません。
ワーカーがジョブ マネージャーに接続できない場合、またはクライアント セッションがそのスケジューラを使用するプロファイルを検証できない場合、クラスター ノード間に通信の問題があることを示しています。
考えられる解決策
コマンド ライン インターフェイスを使用した調査
すべてのノードで、それぞれの IP アドレスの解決結果が一致していることを確認してください。ノードのホスト名が、そのノード自身から見た場合と他のノードから見た場合の両方で一致していることを確認します。たとえば、nodeB 上のプロセスが nodeA 上のプロセスに接続できない場合、nodeA のホスト名をローカルと nodeB の両方から確認します。それらのホスト名が一致している必要があります。
ノードが相互を識別できる場合、それらのプロセス間の問題を nodestatus コマンドを使用して診断できます。このコマンドを使用して、ローカル ホスト上で実行されている MATLAB Parallel Server™ プロセスを判別し、リモート ホストからアクセス可能なものを特定します。
たとえば、nodeA 上のワーカーが nodeB 上のジョブ マネージャーに登録できない場合、両方のノードで同じ nodestatus コマンドを実行して、nodeA が nodeB とそのすべての MATLAB Parallel Server プロセスを正しく識別できることを確認します。nodeB で、Linux® または Windows® のコマンド ウィンドウから次のコマンドを実行します。matlabroot は MATLAB のインストール フォルダーです。
cd matlabroot\toolbox\parallel\bin
nodestatus -remotehost nodeBnodeA で同じコマンドを実行します。cd matlabroot\toolbox\parallel\bin
nodestatus -remotehost nodeBhostA で nodestatus コマンドを再度実行し、nodeB で実行中のプロセスに関する nodeA の視点からの詳細情報を取得します。nodestatus -remotehost nodeB -infolevel 3管理センター ツールを使用した調査
管理センター ツールを使用していくつかの通信の問題を診断できます。管理センター ツールの詳細については、管理センターの起動を参照してください。
ノードを管理センターのリストにホスト名を指定して追加できない場合は、代わりに IP アドレスを使用できます。詳細については、ホストの追加を参照してください。
MATLAB ジョブ スケジューラ ノード、ワーカー ノード、および管理センターが稼動しているノードの間の通信をテストするには、管理センター ツールで [接続のテスト] を選択して [接続テスト] ダイアログ ボックスを開きます。それらのテストにより、ノードが相互を識別でき、ノードのプロセス間で通信できることが検証されます。いずれかの通信テストに失敗すると、問題の診断に使用できる情報が管理センターから提供されます。詳細については、管理センターでの MATLAB ジョブ スケジューラ クラスターの接続テストを参照してください。