このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
カーネルあたりの最大ブロック数
説明
カーネル起動時に作成される CUDA® ブロックの最大数を指定します。
GPU デバイスのストリーミング マルチプロセッサ (SM) のリソースは限られているため、カーネルあたりのブロック数を制限すると、ブロックのスケジューリング、読み込み、およびアンロードによるパフォーマンス低下を回避できます。
ループの反復回数がカーネルあたりの最大ブロック数を超える場合、コード ジェネレーターはストライドを使用して CUDA カーネルを作成します。
カーネルあたりの最大ブロック数を指定すると、コード ジェネレーターは 1 次元のカーネルを作成します。コード ジェネレーターで 2 次元または 3 次元のカーネルを強制的に作成するには、coder.gpu.kernel
(GPU Coder) プラグマを使用します。coder.gpu.kernel
プラグマは、各 CUDA ブロックの最大カーネル数よりも優先されます。
カテゴリ: [コード生成]、[GPU コード]
設定
既定の設定: 0
カーネル起動時に作成される CUDA ブロックの最大数を指定します。
依存関係
このパラメーターには GPU Coder™ のライセンスが必要です。
このパラメーターを有効にするには、[コード生成] ペインで [GPU コードの生成] を選択します。
コマンド ライン情報
パラメーター: GPUMaximumBlocksPerKernel |
タイプ: 整数 |
値: 任意の有効な値 |
既定の設定: 0 |