マルチコアターゲットでの最適化と展開

このトピックでは、明示的な分割を使用して同時実行用に構成されたモデルを使用し、ターゲットに展開する方法について説明します。同時実行用にモデルを設定するには、同時実行用のモデルの構成を参照してください。ターゲットアーキテクチャを指定するには、ターゲットアーキテクチャの指定を参照してください。同時実行用に設定されたモデルで明示的な分割を使用するには、明示的な分割を使用したモデルの分割を参照してください。

コードの生成

同時実行用に構成されたモデルのコードを生成するには、Simulink^® エディターの [アプリ] タブで [Simulink Coder] を選択します。[C コード] タブで、[ビルド] を選択します。結果として得られるコードは次のとおりです。

[同時実行] ダイアログボックスでタスクとトリガーにマッピングされるモデルの一部を表す C コード。C コードの生成には Simulink Coder™ ライセンスが必要です。詳細については、コード生成 (Simulink Coder)およびコード生成 (Embedded Coder)を参照してください。
[同時実行] ダイアログボックスでハードウェアノードにマッピングされるモデルの一部を表す HDL コード。HDL コードの生成には HDL Coder™ ライセンスが必要です。詳細については、Simulink からの HDL コード生成 (HDL Coder)を参照してください。
同時実行タスクとトリガー間のデータ転送を処理し、ハードウェアコンポーネントとソフトウェアコンポーネントとのインターフェイスをとるコード。

生成された C コードには、システムで定義されたタスクまたはトリガーごとに 1 つの関数が含まれます。以下のように、タスクとトリガーによって関数の名前が決まります。

void <TriggerName>_TaskName(void);

このような各関数の内容は、次の場合を除き、ターゲットに依存しない C コードで構成されます。

ターゲット固有の機能を実装するブロックに対応するコード
カスタムストレージクラスから派生したものを含むカスタマイズ (Struct ストレージクラスを使用してパラメーターデータを構造体に整理する (Embedded Coder) 参照) またはコード置換ライブラリ (Simulink Coder)
タスク間でのデータの転送方法を処理するために生成されるコード。特に、Simulink Coder は相互排除プリミティブとデータ同期セマフォのターゲット固有の実装を使用して、以下の疑似コード表で説明しているようにデータ転送を実装します。

データ転送	初期化	リーダー	ライター
データの整合性のみ	BufferIndex = 0; Initialize Buffer[1] with IC	Begin mutual exclusion Tmp = 1 - BufferIndex; End mutual exclusiton Read Buffer[ Tmp ];	Write Buffer[ BufferIndex ]; Begin mutual exclusion BufferIndex = 1 - BufferIndex; End mutual exclusion
確定性を確保 (最大遅延)	WriterIndex = 0; ReaderIndex = 1; Initialize Buffer[1] with IC	Read Buffer[ ReaderIndex ]; ReaderIndex = 1 - ReaderIndex;	Write Buffer[ WriterIndex ] WriterIndex = 1 - WriterIndex;
確定性を確保 (最小遅延)	N/A	Wait dataReady; Read data; Post readDone;	Wait readDone; Write data; Post dataReady;
データの整合性のみ C-HDL インターフェイス	Simulink Coder 製品と HDL Coder 製品はどちらもターゲット固有の通信実装およびデバイスを使用して、ハードウェアコンポーネントとソフトウェアコンポーネント間のデータ転送を処理します。

生成された HDL コードにはハードウェアノードごとに 1 つの HDL プロジェクトが含まれます。

デスクトップでのビルド

Simulink Coder および Embedded Coder^® ターゲットは、Windows^®、Linux^® および macOS オペレーティングシステム用のコードを生成するサンプルのターゲットを提供します。これは "ネイティブスレッドの例" と呼ばれ、デスクトップターゲットへのモデルの展開に使用されています。デスクトップが最終ターゲットではない場合でも、別のターゲットに展開する前にモデルのプロファイルを作成して最適化するのに役立てることができます。

Embedded Coder ターゲットを指定した場合は、[コンフィギュレーションパラメーター] ダイアログボックスで次の変更を行います。

[コード生成] 、 [テンプレート] 、 [メインプログラム例の生成] チェックボックスをオンにします。
[コード生成] 、 [テンプレート] 、 [ターゲットオペレーティングシステム] リストの [NativeThreadsExample] を選択します。
[OK] をクリックして変更を保存し、[コンフィギュレーションパラメーター] ダイアログボックスを閉じます。
モデル内のすべての参照モデルにこれらの設定を適用します。

モデルを設定したら、Ctrl-B を押してモデルをデスクトップにビルドし、展開します。ネイティブスレッドの例では、ネイティブスレッドの例で使用されるスレッド APIに示すように、Simulink Coder および Embedded Coder でターゲット固有のスレッド API とデータ管理プリミティブを使用する方法について説明します。同時に実行しているタスク間のデータ転送は、データ転送オプションに示すように動作します。コード生成製品は、ネイティブスレッドの例で使用されるデータ保護と同期 APIに示すように、この動作がサポートされているターゲットで API を使用します。

ネイティブスレッドの例で使用されるスレッド API

同時実行の側面	Linux 実装	Windows 実装	macOS 実装
周期的なトリガーイベント	POSIX タイマー	Windows タイマー	該当なし
非周期的なトリガーイベント	POSIX リアルタイム信号	Windows イベント	POSIX 非リアルタイム信号
非周期的トリガー	非周期的タスクにマッピングされているブロックの場合: 信号待ちスレッド非周期的トリガーにマッピングされているブロックの場合: 信号アクション	イベント待ちスレッド	非周期的タスクにマッピングされているブロックの場合: 信号待ちスレッド非周期的トリガーにマッピングされているブロックの場合: 信号アクション
スレッド	POSIX^®	Windows	POSIX
スレッド優先順位	サンプル時間に基づいて割り当て: 最速タスクに最高の優先順位	優先順位クラスは親プロセスから継承。サンプル時間に基づいて割り当て: 最初の 3 つの最速タスクについては、最速タスクに最高の優先順位を割り当て。残りのタスクは最低の優先順位を共有。	サンプル時間に基づいて割り当て: 最速タスクに最高の優先順位
オーバーラン検出の例	あり	あり	なし

ネイティブスレッドの例で使用されるデータ保護と同期 API

API	Linux 実装	Windows 実装	macOS 実装
データ保護 API	`pthread_mutex_init` `pthread_mutex_destroy` `pthread_mutex_lock` `pthread_mutex_unlock`	`CreateMutex` `CloseHandle` `WaitForSingleObject` `ReleaseMutex`	`pthread_mutex_init` `pthread_mutex_destroy` `pthread_mutex_lock` `pthread_mutex_unlock`
同期 API	`sem_init` `sem_destroy` `sem_wait` `sem_post`	`CreateSemaphore` `CloseHandle` `WaitForSingleObject` `ReleaseSemaphore`	`sem_open` `sem_unlink` `sem_wait` `sem_post`

デスクトップでの明示的に分割されたモデルのプロファイルと評価

[同時実行] ダイアログボックスの [プロファイルレポート] ペインを使用して、マルチコアターゲット上でコードの実行をプロファイリングします。Simulink Coder (GRT) および Embedded Coder (ERT) ターゲットを使用してプロファイリングを実行できます。プロファイリングを行うと、実行のボトルネックとなっている領域をモデル内で特定しやすくなります。各タスクの実行時間を分析して、実行時間の大半を占めているタスクを見つけることが可能です。たとえば、タスクの平均実行時間を比較できます。計算量の多いタスクやリアルタイム要件とオーバーランを満たしていないタスクがある場合は、計算量が少なく同時実行が可能なタスクにそのタスクを分割することができます。

プロファイルレポートを生成すると、ソフトウェアは以下の処理を実行します。

モデルを作成します。
モデルのコードを生成します。
データを収集する目的で、生成されたコードにツールを追加します。
生成されたコードをターゲット上で実行してデータを収集します。
データを照合し、現在のフォルダーに HTML ファイル (model_name_ProfileReport.html) を生成して、[同時実行] ダイアログボックスの [プロファイルレポート] ペインに HTML ファイルを表示します。
メモ
モデルの HTML プロファイルレポートが存在する場合、そのファイルが [プロファイルレポート] ペインに表示されます。新しいプロファイルレポートを生成するには、をクリックします。

セクション説明

セクション	説明
概要	合計実行時間やプロファイルレポートの作成時間など、モデルの実行に関連する統計情報をまとめて表示します。ホストマシン上のコア合計数も表示します。
Task Execution Time	タスク別に色分けされた円グラフに、各タスクの実行時間 (マイクロ秒単位) を表示します。 Windows、Linux、および macOS プラットフォームで表示されます。
Task Affinitization to Processor Cores	プラットフォームに依存します。タイムステップおよびタスクごとに、Simulink はそのタイムステップでタスクの実行が開始されたプロセッサコア番号をプロセッサ別に色分けして表示します。特定のタイムステップにスケジューリングされたタスクが存在しない場合、`NR` が表示されます。 Windows および Linux プラットフォームで表示されます。

概要

合計実行時間やプロファイルレポートの作成時間など、モデルの実行に関連する統計情報をまとめて表示します。ホストマシン上のコア合計数も表示します。

Task Execution Time

タスク別に色分けされた円グラフに、各タスクの実行時間 (マイクロ秒単位) を表示します。

Windows、Linux、および macOS プラットフォームで表示されます。

Task Affinitization to Processor Cores

プラットフォームに依存します。タイムステップおよびタスクごとに、Simulink はそのタイムステップでタスクの実行が開始されたプロセッサコア番号をプロセッサ別に色分けして表示します。

特定のタイムステップにスケジューリングされたタスクが存在しない場合、NR が表示されます。

Windows および Linux プラットフォームで表示されます。

プロファイルレポートを解析したら、Model ブロックのマッピングを変更することにより、マルチコアシステムで利用可能な同時実行性を効率的に利用することを検討してください (タスク、トリガー、ノードへのブロックのマッピングを参照)。

プロファイルレポートの生成

このトピックでは、同時実行に対してプロファイルできるようモデルを構成済みであることが前提になります。詳細については、同時実行用のモデルの構成を参照してください。

[同時実行] ダイアログボックスで [プロファイルレポート] ノードをクリックします。
プロファイルツールは、model_name_ProfileReport.html という名前のファイルを検索します。該当するファイルが現在のモデルに存在しない場合、[プロファイルレポート] ペインに以下のように表示されます。
メモ
モデルの HTML プロファイルレポートが存在する場合、そのファイルが [プロファイルレポート] ペインに表示されます。新しいプロファイルレポートを生成するには、をクリックします。
モデルの実行データをプロファイラーで収集する場合のタイムステップの数を入力します。
[タスク実行のプロファイルレポートを生成します] ボタンをクリックします。
この操作により、モデルの作成、コードの生成、コードへのデータ収集ツールの追加、ターゲットでのコードの実行といった処理が行われて、HTML プロファイルレポートも生成されます。この処理には、数分かかることがあります。この処理が完了したら、プロファイルレポートの内容が [プロファイルレポート] ペインに表示されます。以下に例を示します。
プロファイリングレポートには、概要、各タスクの実行時間、プロセッサコアへの各タスクのマッピングが表示されます。タスク 1 とタスク 2 がコア 0 で実行され、タスク 3 とタスク 4 がコア 1 で実行されることがわかります。レポートの [Task Execution Time] セクションは、タスク 1 とタスク 3 の実行にかかる時間が最長であることを示しています。タスク 3 の周期はタスク 1 とタスク 2 の周期の 2 倍であり、タスク 4 の周期はタスク 3 の周期の 2 倍であることに注意してください。
プロファイルレポートを解析します。必要に応じてモデルまたはタスクのマッピングを作成および変更し、プロファイルレポートを再生成します。

コマンドラインでのプロファイルレポートの生成. 別の方法として、同時実行に対して構成されたモデルのプロファイルレポートをコマンドラインで生成できます。関数 Simulink.architecture.profile を使用します。

たとえば、モデル slexMulticoreSolverExample のプロファイルレポートを作成するには、以下の手順に従います。

openExample('slexMulticoreSolverExample');
Simulink.architecture.profile('slexMulticoreSolverExample');

特定のサンプル数 (100) でモデル slexMulticoreSolverExample のプロファイルレポートを作成するには、以下のようにします。

Simulink.architecture.profile('slexMulticoreSolverExample',120);

この関数は、slexMulticoreSolverExample_ProfileReport.html という名前のプロファイルレポートを現在のフォルダーに作成します。

生成された C コードのカスタマイズ

生成されたコードは、さまざまなアプリケーションおよび開発環境で利用できます。ニーズを満たすために、コードとツールのカスタマイズ (Embedded Coder)の説明に従って生成された C コードをカスタマイズします。これらのカスタマイズ機能に加え、マルチコアターゲットと異種混合ターゲットの場合は、生成されたコードを次のようにさらにカスタマイズできます。

コード置換ライブラリを使用して、相互排除とデータ同期プリミティブの選択した実装を登録できます。
[同時実行] ダイアログボックスでタスクとトリガーに対してターゲット固有のプロパティを指定できるカスタムターゲットアーキテクチャファイルを定義できます。詳細については、カスタムアーキテクチャファイルの定義を参照してください。