メインコンテンツ

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

カーネルあたりの最大ブロック数

GPU カーネルあたりのスレッド ブロックの最大数

R2021a 以降

モデル コンフィギュレーション ペイン: コード生成 / GPU コード

説明

[カーネルあたりの最大ブロック数] パラメーターは、カーネルの起動時に作成される CUDA® ブロックの最大数を指定します。

GPU デバイスのストリーミング マルチプロセッサ (SM) リソースは限られているため、各カーネルのブロック数を制限することで、ブロックのスケジューリング、ロード、およびアンロードによるパフォーマンスの低下を回避できます。

ループ内の反復回数がカーネルあたりの最大ブロック数よりも多い場合、コード ジェネレーターはストライドを使用して CUDA カーネルを作成します。

各カーネルの最大ブロック数を指定すると、コード ジェネレーターは 1 次元カーネルを作成します。コード ジェネレーターに 2 次元カーネルまたは 3 次元カーネルを強制的に作成させるには、coder.gpu.kernel プラグマを使用します。coder.gpu.kernel プラグマは、各 CUDA ブロックのカーネルの最大数よりも優先されます。

依存関係

  • このパラメーターには GPU Coder™ のライセンスが必要です。

  • このパラメーターを有効にするには、[コード生成] ペインの [GPU コードの生成] を選択します。

設定

0 (既定値) | 整数

カーネルの起動中に作成される CUDA ブロックの最大数を指定します。

推奨設定

用途設定
デバッグ影響なし
トレーサビリティ影響なし
効率性影響なし
安全対策影響なし

プログラムでの使用

パラメーター: GPUMaximumBlocksPerKernel
型: 整数
値: 任意の有効な値
既定値: 0

バージョン履歴

R2021a で導入