Main Content

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

カーネルあたりの最大ブロック数

説明

カーネル起動時に作成される CUDA® ブロックの最大数を指定します。

GPU デバイスのストリーミング マルチプロセッサ (SM) のリソースは限られているため、カーネルあたりのブロック数を制限すると、ブロックのスケジューリング、読み込み、およびアンロードによるパフォーマンス低下を回避できます。

ループの反復回数がカーネルあたりの最大ブロック数を超える場合、コード ジェネレーターはストライドを使用して CUDA カーネルを作成します。

カーネルあたりの最大ブロック数を指定すると、コード ジェネレーターは 1 次元のカーネルを作成します。コード ジェネレーターで 2 次元または 3 次元のカーネルを強制的に作成するには、coder.gpu.kernel (GPU Coder) プラグマを使用します。coder.gpu.kernel プラグマは、各 CUDA ブロックの最大カーネル数よりも優先されます。

カテゴリ: [コード生成]、[GPU コード]

設定

既定の設定: 0

カーネル起動時に作成される CUDA ブロックの最大数を指定します。

依存関係

  • このパラメーターには GPU Coder™ のライセンスが必要です。

  • このパラメーターを有効にするには、[コード生成] ペインで [GPU コードの生成] を選択します。

コマンド ライン情報

パラメーター: GPUMaximumBlocksPerKernel
タイプ: 整数
値: 任意の有効な値
既定の設定: 0

関連するトピック