このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
カーネルあたりの最大ブロック数
GPU カーネルあたりのスレッド ブロックの最大数
R2021a 以降
モデル コンフィギュレーション ペイン: コード生成 / GPU コード
説明
[カーネルあたりの最大ブロック数] パラメーターは、カーネルの起動時に作成される CUDA® ブロックの最大数を指定します。
GPU デバイスのストリーミング マルチプロセッサ (SM) リソースは限られているため、各カーネルのブロック数を制限することで、ブロックのスケジューリング、ロード、およびアンロードによるパフォーマンスの低下を回避できます。
ループ内の反復回数がカーネルあたりの最大ブロック数よりも多い場合、コード ジェネレーターはストライドを使用して CUDA カーネルを作成します。
各カーネルの最大ブロック数を指定すると、コード ジェネレーターは 1 次元カーネルを作成します。コード ジェネレーターに 2 次元カーネルまたは 3 次元カーネルを強制的に作成させるには、coder.gpu.kernel プラグマを使用します。coder.gpu.kernel プラグマは、各 CUDA ブロックのカーネルの最大数よりも優先されます。
依存関係
このパラメーターには GPU Coder™ のライセンスが必要です。
このパラメーターを有効にするには、[コード生成] ペインの [GPU コードの生成] を選択します。
設定
0 (既定値) | 整数
カーネルの起動中に作成される CUDA ブロックの最大数を指定します。
推奨設定
| 用途 | 設定 |
|---|---|
| デバッグ | 影響なし |
| トレーサビリティ | 影響なし |
| 効率性 | 影響なし |
| 安全対策 | 影響なし |
プログラムでの使用
パラメーター: GPUMaximumBlocksPerKernel |
| 型: 整数 |
| 値: 任意の有効な値 |
既定値: 0 |
バージョン履歴
R2021a で導入
参考
トピック
- モデル コンフィギュレーション パラメーター: GPU コード (Simulink Coder)
- GPU Coder を使用した Simulink モデルからのコード生成