メインコンテンツ

カーネルあたりの最大ブロック数

カーネルの起動中に作成されるブロックの最大数

説明

アプリ構成ペイン: GPU コード

構成オブジェクト: coder.GpuCodeConfig

[カーネルあたりの最大ブロック数] パラメーターは、カーネルの起動時に作成されるブロックの最大数を指定します。

GPU デバイスのストリーミング マルチプロセッサ (SM) リソースは限られているため、各カーネルのブロック数を制限することで、ブロックのスケジューリング、ロード、およびアンロードによるパフォーマンスの低下を回避できます。

ループ内の反復回数がカーネルあたりの最大ブロック数よりも多い場合、コード ジェネレーターはストライドを使用して CUDA® カーネルを作成します。

各カーネルの最大ブロック数を指定すると、コード ジェネレーターは 1 次元カーネルを作成します。コード ジェネレーターに 2 次元カーネルまたは 3 次元カーネルを強制的に作成させるには、coder.gpu.kernel プラグマを使用します。coder.gpu.kernel プラグマは、各ブロックのカーネルの最大数よりも優先されます。

設定

0 (既定) | 整数

0

GPU Coder™ は、カーネルあたりのブロック数を CUDA で許可されている最大数に制限します。

整数

カーネル起動時に作成するブロックの最大数を入力します。

プログラムでの使用

プロパティ: MaximumBlocksPerKernel
値: 0 | 整数
既定の設定: 0

バージョン履歴

R2021a で導入