Main Content

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

MATLAB コードからのカーネルの作成

CUDA® GPU カーネルを作成する MATLAB コードの構造とパターン

GPU Coder™ は、MATLAB® コードの特定のアルゴリズム構造およびパターンについての最適化 CUDA カーネルを生成して実行します。生成コードでは、cuFFT、cuSolver、cuBLAS、cuDNN、TensorRT など、最適化された NVIDIA® CUDA ライブラリが呼び出されます。生成コードは、ソース コード、スタティック ライブラリ、またはダイナミック ライブラリとしてプロジェクトに統合でき、デスクトップ用、サーバー用、および NVIDIA Jetson、DRIVE、その他のプラットフォームに組み込まれた GPU 用にコンパイルできます。GPU Coder では、手書きの CUDA コードをアルゴリズムおよび生成コードに組み込むことが可能です。

アプリ

すべて展開する

GPU CoderMATLAB コードからの GPU コードの生成
GPU 環境のチェックGPU コード生成環境の検証と設定

関数

すべて展開する

codegenMATLAB コードから C/C++ コードを生成する
gpucoderGPU Coder アプリを開く
coder.checkGpuInstallGPU コード生成環境の検証
coder.gpuConfigGPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター
coder.gpu.kernelfor ループを GPU カーネルにマッピングするプラグマ
coder.gpu.kernelfun関数を GPU カーネルにマッピングするプラグマ
coder.gpu.nokernelループのカーネル作成を無効にするプラグマ
coder.ceval外部 C/C++ 関数の呼び出し
coder.gpu.iterations変数範囲ループの並列化を判定するための情報をコード ジェネレーターに提供するプラグマ
coder.gpu.constantMemory変数を GPU の定数メモリにマッピングするプラグマ
coder.gpu.persistentMemory変数を GPU の永続メモリとして割り当てるためのプラグマ (R2020b 以降)
gpucoder.atomicAdd指定された値のグローバル メモリまたは共有メモリの変数へのアトミックな加算 (R2021b 以降)
gpucoder.atomicAnd指定された値とグローバル メモリまたは共有メモリの変数の間でのビット単位 AND のアトミックな実行 (R2021b 以降)
gpucoder.atomicCASグローバル メモリまたは共有メモリの変数の値のアトミックな比較交換 (R2021b 以降)
gpucoder.atomicDec指定された上限内でのグローバル メモリまたは共有メモリの変数のアトミックなデクリメント (R2021b 以降)
gpucoder.atomicExch指定された値とグローバル メモリまたは共有メモリの変数のアトミックな交換 (R2021b 以降)
gpucoder.atomicInc指定された上限内でのグローバル メモリまたは共有メモリの変数のアトミックなインクリメント (R2021b 以降)
gpucoder.atomicMax指定された値とグローバル メモリまたは共有メモリの変数の間での最大値のアトミックな検索 (R2021b 以降)
gpucoder.atomicMin指定された値とグローバル メモリまたは共有メモリの変数の間での最小値のアトミックな検索 (R2021b 以降)
gpucoder.atomicOr指定された値とグローバル メモリまたは共有メモリの変数の間でのビット単位 OR のアトミックな実行 (R2021b 以降)
gpucoder.atomicSub指定された値のグローバル メモリまたは共有メモリの変数からのアトミックな減算 (R2021b 以降)
gpucoder.atomicXor指定された値とグローバル メモリまたは共有メモリの変数の間でのビット単位 XOR のアトミックな実行 (R2021b 以降)
half半精度数値オブジェクトの作成
stencilfunステンシル関数の CUDA コードの生成 (R2022b 以降)
gpucoder.matrixMatrixKernel行列-行列演算を含む関数の最適化された GPU 実装
gpucoder.batchedMatrixMultiplyバッチ行列乗算演算の最適化された GPU 実装 (R2020a 以降)
gpucoder.stridedMatrixMultiplyストライド バッチ行列乗算演算の最適化された GPU 実装 (R2020a 以降)
gpucoder.batchedMatrixMultiplyAdd加算を伴うバッチ行列乗算演算の最適化された GPU 実装 (R2020a 以降)
gpucoder.stridedMatrixMultiplyAdd加算を伴うストライド バッチ行列乗算演算の最適化された GPU 実装 (R2020a 以降)
gpucoder.sortMATLAB 関数 sort の最適化された GPU 実装
gpucoder.ctransposeMATLAB 関数 transpose の最適化された GPU 実装
gpucoder.transposeMATLAB 関数 transpose の最適化された GPU 実装
gpucoder.reduceリダクション演算の最適化された GPU 実装 (R2019b 以降)

オブジェクト

すべて展開する

coder.gpuConfigGPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター
coder.CodeConfigMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.EmbeddedCodeConfigEmbedded CoderMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.gpuEnvConfigGPU コード生成環境チェックを実行するために coder.checkGpuInstall に渡されるパラメーターが含まれる構成オブジェクトの作成

トピック