Main Content

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

カーネルの作成

CUDA® GPU カーネルを作成するアルゴリズムの構造とパターン

CUDA カーネルは GPU デバイスで実行される関数です。これらのカーネルは多数の GPU スレッドで並列に実行されます。アルゴリズムの計算量の多い部分を効率的にカーネルにマッピングすることで、GPU コンピューティング テクノロジーによりもたらされるパフォーマンスの改善を活用できます。GPU Coder™ をトリガーし、MATLAB® コードの特定のアルゴリズム構造およびパターンについて CUDA カーネルを作成できます。

アプリ

GPU CoderMATLAB コードからの GPU コードの生成
Check GPU InstallGPU コード生成環境の検証と設定

関数

half半精度数値オブジェクトの作成
coder.checkGpuInstallGPU コード生成環境の検証
coder.gpuConfigGPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター
codegenMATLAB コードから C/C++ コードを生成する
gpucoderGPU Coder アプリを開く
coder.gpu.kernelfor ループを GPU カーネルにマッピングするプラグマ
coder.gpu.kernelfun関数を GPU カーネルにマッピングするプラグマ
coder.gpu.nokernelループのカーネル作成を無効にするプラグマ
coder.gpu.constantMemory変数を GPU の定数メモリにマッピングするプラグマ
gpucoder.stencilKernelステンシル関数の CUDA コードの作成
gpucoder.matrixMatrixKernel行列-行列演算を含む関数の最適化された GPU 実装
gpucoder.batchedMatrixMultiplyバッチ行列乗算演算の最適化された GPU 実装
gpucoder.stridedMatrixMultiplyストライド バッチ行列乗算演算の最適化された GPU 実装
gpucoder.batchedMatrixMultiplyAdd加算を伴うバッチ行列乗算演算の最適化された GPU 実装
gpucoder.stridedMatrixMultiplyAdd加算を伴うストライド バッチ行列乗算演算の最適化された GPU 実装
gpucoder.sortMATLAB 関数 sort の最適化された GPU 実装
coder.gpu.iterations変数範囲ループの並列化を判定するための情報をコード ジェネレーターに提供するプラグマ
gpucoder.transposeMATLAB 関数 transpose の最適化された GPU 実装
gpucoder.reduceリダクション演算の最適化された GPU 実装
coder.ceval外部 C/C++ 関数の呼び出し

オブジェクト

coder.gpuConfigGPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター
coder.CodeConfigMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.EmbeddedCodeConfigEmbedded CoderMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.gpuEnvConfigGPU コード生成環境チェックを実行するために coder.checkGpuInstall に渡されるパラメーターが含まれる構成オブジェクトの作成

トピック

要素単位ループのカーネル

スカラー化された要素単位の数学演算を含む MATLAB 関数からカーネルを作成する。

スキャッター/ギャザー タイプ演算のカーネル

リダクション演算を含む MATLAB 関数からカーネルを作成する。

ライブラリの呼び出しのカーネル

cuBLAS、cuSOLVER、cuFFT、Thrust など、GPU 用に最適化された数学ライブラリをターゲットにする。

GPU 配列のサポート

GPU 配列を使用する CUDA コードを生成します。

レガシ コードの統合

コード生成のためにカスタム GPU コードと MATLAB コードを統合する。

設計パターン

計算設計パターンを含む MATLAB 関数のカーネルを作成する。

GPU メモリの割り当てと最小化

GPU Coder のメモリ割り当てオプションおよび最適化。

注目の例