coder.gpu.kernelfun
関数を GPU カーネルにマッピングするプラグマ
説明
coder.gpu.kernelfun()
は、それが配置されている関数内のすべての計算を GPU にマッピングしようとするグローバル レベルのプラグマです。この関数内のループが GPU カーネルに並列化されるのは、並列ループ解析チェックをパスした場合のみです。この解析は、すべてのループ反復が互いに依存していないことを証明しようとします。さらに、コード ジェネレーターは、反復回数が少ないループや最小限の計算を実行するループなどの単純なループに対しては GPU カーネルを作成しません。このようなループを並列化すると、カーネルの作成や GPU と CPU の間のメモリ転送のオーバーヘッドにより、コードのパフォーマンスが低下する可能性があります。
kernelfun
プラグマに入力パラメーターは必要ありません。生成されるカーネルの次元は、ループ パラメーターに基づいて自動的に計算されます。
この関数はコード生成関数です。MATLAB® では効果がありません。
例
バージョン履歴
R2017b で導入
参考
アプリ
関数
codegen
|coder.gpu.kernel
|gpucoder.stencilKernel
|coder.gpu.constantMemory
|gpucoder.reduce
|gpucoder.sort
|coder.gpu.nokernel