Main Content

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

MATLAB コードからのカーネルの作成

CUDA® GPU カーネルを作成する MATLAB コードの構造とパターン

GPU Coder™ は、MATLAB® コードの特定のアルゴリズム構造およびパターンについての最適化 CUDA カーネルを生成して実行します。生成コードでは、cuFFT、cuSolver、cuBLAS、cuDNN、TensorRT など、最適化された NVIDIA® CUDA ライブラリが呼び出されます。生成コードは、ソース コード、スタティック ライブラリ、またはダイナミック ライブラリとしてプロジェクトに統合でき、デスクトップ用、サーバー用、および NVIDIA Jetson、DRIVE、その他のプラットフォームに組み込まれた GPU 用にコンパイルできます。GPU Coder では、手書きの CUDA コードをアルゴリズムおよび生成コードに組み込むことが可能です。

アプリ

すべて展開する

GPU CoderMATLAB コードからの GPU コードの生成
GPU 環境のチェックGPU コード生成環境の検証と設定

関数

すべて展開する

codegenMATLAB コードから C/C++ コードを生成する
gpucoderGPU Coder アプリを開く
coder.checkGpuInstallGPU コード生成環境の検証
coder.gpuConfigGPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター
coder.gpu.kernelfor ループを GPU カーネルにマッピングするプラグマ
coder.gpu.kernelfun関数を GPU カーネルにマッピングするプラグマ
coder.gpu.nokernelループのカーネル作成を無効にするプラグマ
coder.ceval外部 C/C++ 関数の呼び出し
coder.gpu.iterations変数範囲ループの並列化を判定するための情報をコード ジェネレーターに提供するプラグマ
coder.gpu.constantMemory変数を GPU の定数メモリにマッピングするプラグマ
coder.gpu.persistentMemory変数を GPU の永続メモリとして割り当てるためのプラグマ
gpucoder.atomicAdd指定された値のグローバル メモリまたは共有メモリの変数へのアトミックな加算
gpucoder.atomicAnd指定された値とグローバル メモリまたは共有メモリの変数の間でのビット単位 AND のアトミックな実行
gpucoder.atomicCASグローバル メモリまたは共有メモリの変数の値のアトミックな比較交換
gpucoder.atomicDec指定された上限内でのグローバル メモリまたは共有メモリの変数のアトミックなデクリメント
gpucoder.atomicExch指定された値とグローバル メモリまたは共有メモリの変数のアトミックな交換
gpucoder.atomicInc指定された上限内でのグローバル メモリまたは共有メモリの変数のアトミックなインクリメント
gpucoder.atomicMax指定された値とグローバル メモリまたは共有メモリの変数の間での最大値のアトミックな検索
gpucoder.atomicMin指定された値とグローバル メモリまたは共有メモリの変数の間での最小値のアトミックな検索
gpucoder.atomicOr指定された値とグローバル メモリまたは共有メモリの変数の間でのビット単位 OR のアトミックな実行
gpucoder.atomicSub指定された値のグローバル メモリまたは共有メモリの変数からのアトミックな減算
gpucoder.atomicXor指定された値とグローバル メモリまたは共有メモリの変数の間でのビット単位 XOR のアトミックな実行
gpucoder.stencilKernelステンシル関数の CUDA コードの作成
gpucoder.matrixMatrixKernel行列-行列演算を含む関数の最適化された GPU 実装
gpucoder.batchedMatrixMultiplyバッチ行列乗算演算の最適化された GPU 実装
gpucoder.stridedMatrixMultiplyストライド バッチ行列乗算演算の最適化された GPU 実装
gpucoder.batchedMatrixMultiplyAdd加算を伴うバッチ行列乗算演算の最適化された GPU 実装
gpucoder.stridedMatrixMultiplyAdd加算を伴うストライド バッチ行列乗算演算の最適化された GPU 実装
gpucoder.sortMATLAB 関数 sort の最適化された GPU 実装
gpucoder.transposeMATLAB 関数 transpose の最適化された GPU 実装
gpucoder.reduceリダクション演算の最適化された GPU 実装

オブジェクト

すべて展開する

coder.gpuConfigGPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター
coder.CodeConfigMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.EmbeddedCodeConfigEmbedded CoderMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.gpuEnvConfigGPU コード生成環境チェックを実行するために coder.checkGpuInstall に渡されるパラメーターが含まれる構成オブジェクトの作成

トピック