カーネルあたりの最大ブロック数
カーネルの起動中に作成されるブロックの最大数
説明
アプリ構成ペイン: GPU コード
構成オブジェクト: coder.GpuCodeConfig
[カーネルあたりの最大ブロック数] パラメーターは、カーネルの起動時に作成されるブロックの最大数を指定します。
GPU デバイスのストリーミング マルチプロセッサ (SM) リソースは限られているため、各カーネルのブロック数を制限することで、ブロックのスケジューリング、ロード、およびアンロードによるパフォーマンスの低下を回避できます。
ループ内の反復回数がカーネルあたりの最大ブロック数よりも多い場合、コード ジェネレーターはストライドを使用して CUDA® カーネルを作成します。
各カーネルの最大ブロック数を指定すると、コード ジェネレーターは 1 次元カーネルを作成します。コード ジェネレーターに 2 次元カーネルまたは 3 次元カーネルを強制的に作成させるには、coder.gpu.kernel プラグマを使用します。coder.gpu.kernel プラグマは、各ブロックのカーネルの最大数よりも優先されます。
設定
0 (既定) | 整数
0GPU Coder™ は、カーネルあたりのブロック数を CUDA で許可されている最大数に制限します。
- 整数
カーネル起動時に作成するブロックの最大数を入力します。
プログラムでの使用
プロパティ: MaximumBlocksPerKernel |
値: 0 | 整数 |
既定の設定: 0 |
バージョン履歴
R2021a で導入