coder.gpuConfig

GPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター

説明

coder.GpuCodeConfig オブジェクトまたは coder.gpuConfig オブジェクトには、GPU Coder™ を使って CUDA^® MEX、スタティックライブラリ、ダイナミックリンクライブラリ、または実行可能プログラムを生成するために codegen で使用される構成パラメーターが含まれています。-config オプションを使用してこのオブジェクトを関数 codegen に渡します。

作成

構文

cfg = coder.gpuConfig(build_type)

cfg = coder.gpuConfig(build_type,'ecoder',false)

cfg = coder.gpuConfig(build_type,'ecoder',true)

説明

例

cfg = coder.gpuConfig(build_type) は、指定したビルドタイプのコード生成構成オブジェクトを作成します。このビルドタイプには、CUDA MEX、スタティックライブラリ、ダイナミックリンクライブラリ、または実行可能プログラムを指定できます。Embedded Coder^® 製品がインストールされている場合、スタティックライブラリ、ダイナミックリンクライブラリ、または実行可能ファイルのビルドタイプ用の coder.EmbeddedCodeConfig オブジェクトを作成します。

cfg = coder.gpuConfig(build_type,'ecoder',false) は、Embedded Coder 製品がインストールされている場合でも CUDA 'lib'、'dll'、または 'exe' 出力を生成するためのコード生成構成オブジェクトを作成します。

cfg = coder.gpuConfig(build_type,'ecoder',true) は、Embedded Coder 製品がインストールされていない場合でも coder.EmbeddedCodeConfig 構成オブジェクトを作成します。ただし、coder.EmbeddedCodeConfig オブジェクトを使用したコード生成には、Embedded Coder のライセンスが必要です。

入力引数

すべて展開する

`build_type` — 生成された CUDA コードからビルドする出力
`'MEX'` | `'LIB'` | `'DLL'` | `'EXE'`

生成された CUDA コードからビルドする出力。次の表のいずれかの値を指定します。

値	説明
`'MEX'`	CUDA MEX
`'LIB'`	スタティックライブラリ
`'DLL'`	ダイナミックリンクライブラリ
`'EXE'`	実行可能プログラム

プロパティ

すべて展開する

coder.GpuConfig には、コード構成オブジェクトの GPU 固有の構成パラメーターのみが含まれます。コード構成オブジェクトのプロパティを表示するには、coder.CodeConfig および coder.EmbeddedCodeConfig を参照してください。

`Enabled` — GPU コード生成の制御
`true` (既定値) | `false`

次の表のいずれかの値を使用した CUDA (*.cu) ファイルの生成制御。

値説明

値	説明
`true`	この値は既定値です。 CUDA コード生成を有効にします。
`false`	CUDA コード生成を無効にします。

true

この値は既定値です。

CUDA コード生成を有効にします。

false

CUDA コード生成を無効にします。

例: cfg.GpuConfig.Enabled = true

`MallocMode` — GPU メモリの割り当て
`'discrete'` (既定値) | `'unified'`

生成された CUDA コードで使用されるメモリ割り当て (malloc) モード。次の表のいずれかの値を指定します。

値説明

値	説明
`'discrete'`	この値は既定値です。生成コードでは、CPU と GPU 間でのデータ転送に `cudaMalloc` API が使用されます。プログラマの観点から見ると、この離散モードでは、個別の CPU および GPU のグローバルメモリアドレス空間を使う従来のメモリアーキテクチャが使用されます。
`'unified'`	生成コードでは、共有 (統合) された CPU および GPU グローバルメモリアドレス空間を使う `cudaMallocManaged` API が使用されます。 NVIDIA^® 組み込みターゲットの場合のみ。ホストでの unified メモリ割り当てモードは削除予定を参照してください。

'discrete'

この値は既定値です。

生成コードでは、CPU と GPU 間でのデータ転送に cudaMalloc API が使用されます。プログラマの観点から見ると、この離散モードでは、個別の CPU および GPU のグローバルメモリアドレス空間を使う従来のメモリアーキテクチャが使用されます。

'unified'

生成コードでは、共有 (統合) された CPU および GPU グローバルメモリアドレス空間を使う cudaMallocManaged API が使用されます。

NVIDIA^® 組み込みターゲットの場合のみ。ホストでの unified メモリ割り当てモードは削除予定を参照してください。

詳細については、離散および管理モードを参照してください。

例: cfg.GpuConfig.MallocMode = 'discrete'

`KernelNamePrefix` — カスタムのカーネル名の接頭辞
' ' (既定値) | 文字ベクトル

生成コードのすべてのカーネルに対してカスタム名の接頭辞を指定します。たとえば、値 'CUDA_' を使用すると、CUDA_kernel1 や CUDA_kernel2 などの名前のカーネルが作成されます。名前を指定しない場合、GPU Coder によって、カーネル名の先頭にエントリポイント関数の名前が追加されます。カーネル名には大文字、小文字、0 ～ 9 の数字、アンダースコア文字 _ を使用できます。GPU Coder は、サポートされていない文字をカーネル名から削除し、先頭がアルファベット文字でない接頭辞には alpha を追加します。

例: cfg.GpuConfig.KernelNamePrefix = 'myKernel'

`EnableCUBLAS` — `cuBLAS` ライブラリの使用
`true` (既定値) | `false`

数学関数の呼び出しと NVIDIA cuBLAS ライブラリの呼び出しの置換。次の表のいずれかの値を指定します。

値説明

値	説明
`true`	この値は既定値です。 GPU Coder で、対応する数学関数の呼び出しを `cuBLAS` ライブラリの呼び出しと置き換えられるようにします。CUDA の置換先がない関数の場合、GPU Coder は移植可能な MATLAB^® 関数を使用してそれらを GPU にマッピングすることを試みます。
`false`	生成コードにおける `cuBLAS` ライブラリの使用を無効にします。

true

この値は既定値です。

GPU Coder で、対応する数学関数の呼び出しを cuBLAS ライブラリの呼び出しと置き換えられるようにします。CUDA の置換先がない関数の場合、GPU Coder は移植可能な MATLAB^® 関数を使用してそれらを GPU にマッピングすることを試みます。

false

生成コードにおける cuBLAS ライブラリの使用を無効にします。

詳細については、ライブラリの呼び出しのカーネルを参照してください。

例: cfg.GpuConfig.EnableCUBLAS = true

`EnableCUSOLVER` — `cuSOLVER` ライブラリの使用
`true` (既定値) | `false`

数学関数の呼び出しと NVIDIA cuSOLVER ライブラリの呼び出しの置換。次の表のいずれかの値を指定します。

値説明

値	説明
`true`	この値は既定値です。 GPU Coder で、対応する数学関数の呼び出しを `cuSOLVER` ライブラリの呼び出しと置き換えられるようにします。CUDA の置換先がない関数の場合、GPU Coder は移植可能な MATLAB 関数を使用してそれらを GPU にマッピングすることを試みます。
`false`	生成コードにおける `cuSOLVER` ライブラリの使用を無効にします。

true

この値は既定値です。

GPU Coder で、対応する数学関数の呼び出しを cuSOLVER ライブラリの呼び出しと置き換えられるようにします。CUDA の置換先がない関数の場合、GPU Coder は移植可能な MATLAB 関数を使用してそれらを GPU にマッピングすることを試みます。

false

生成コードにおける cuSOLVER ライブラリの使用を無効にします。

詳細については、ライブラリの呼び出しのカーネルを参照してください。

例: cfg.GpuConfig.EnableCUSOLVER = true

`EnableCUFFT` — `cuFFT` ライブラリの使用
`true` (既定値) | `false`

関数 fft の呼び出しと NVIDIA cuFFT ライブラリの呼び出しの置換。次の表のいずれかの値を指定します。

値説明

値	説明
`true`	この値は既定値です。 GPU Coder で、適切な `fft` の呼び出しを `cuFFT` ライブラリの呼び出しと置き換えられるようにします。
`false`	生成コードにおける `cuFFT` ライブラリの使用を無効にします。このオプションを指定すると、GPU Coder は C `FFTW` ライブラリを使用する (利用可能な場合) か、移植可能な MATLAB `fft` コードからカーネルを生成します。

true

この値は既定値です。

GPU Coder で、適切な fft の呼び出しを cuFFT ライブラリの呼び出しと置き換えられるようにします。

false

生成コードにおける cuFFT ライブラリの使用を無効にします。このオプションを指定すると、GPU Coder は C FFTW ライブラリを使用する (利用可能な場合) か、移植可能な MATLAB fft コードからカーネルを生成します。

詳細については、ライブラリの呼び出しのカーネルを参照してください。

例: cfg.GpuConfig.EnableCUFFT = true

`Benchmarking` — 生成コードへのベンチマークの追加
`false` (既定値) | `true`

生成された CUDA コードへのベンチマークコードの追加を制御します。次の表のいずれかの値を使用します。

値説明

値	説明
`false`	この値は既定値です。生成された CUDA コードにベンチマーク機能は含まれません。
`true`	ベンチマーク機能を含む CUDA コードを生成します。このオプションは `cudaEvent` などの CUDA API を使用し、`kernel` や `memcpy` などのイベントの時間を計測します。

false

この値は既定値です。

生成された CUDA コードにベンチマーク機能は含まれません。

true

ベンチマーク機能を含む CUDA コードを生成します。このオプションは cudaEvent などの CUDA API を使用し、kernel や memcpy などのイベントの時間を計測します。

実行後、生成されたベンチマークコードにより、現在の作業フォルダーに gpuTimingData コンマ区切り値 (CSV) ファイルが作成されます。CSV ファイルには、カーネル、メモリ、その他のイベントのタイミングデータが格納されています。次の表に、CSV ファイルの形式を示します。

イベントタイプ形式

イベントタイプ	形式
CUDA カーネル	`<name_N>,<block dimension>,<grid dimension>,<execution time in ms>,<name of parent>` `N` はカーネルの N 回目の実行です。`<block dimension>` はブロックの次元の合計を表します。たとえば、ブロックの次元が `dim3(32,32,32)` の場合、`<block dimension>` の値は 32768 になります。
CUDA メモリコピー	`<name_N>,<memory copy size>,<execution time in ms>,<IO flag>,<name of parent>` `N` は、メモリコピーの N 回目の実行です。
その他	`<name_N>,<execution time in ms>,<name of parent>` `N` は、演算の N 回目の実行です。

CUDA カーネル

<name_N>,<block dimension>,<grid dimension>,<execution time in ms>,<name of parent>

N はカーネルの N 回目の実行です。<block dimension> はブロックの次元の合計を表します。たとえば、ブロックの次元が dim3(32,32,32) の場合、<block dimension> の値は 32768 になります。

CUDA メモリコピー

<name_N>,<memory copy size>,<execution time in ms>,<IO flag>,<name of parent>

N は、メモリコピーの N 回目の実行です。

その他

<name_N>,<execution time in ms>,<name of parent>

N は、演算の N 回目の実行です。

例: cfg.GpuConfig.Benchmarking = true

`SafeBuild` — 生成されたコードのエラーチェック
`false` (既定値) | `true`

生成された CUDA コードにエラーチェック機能を追加します。次の表のいずれかの値を使用します。

値説明

値	説明
`false`	この値は既定値です。生成された CUDA コードにエラーチェック機能は含まれません。
`true`	CUDA API やカーネルの呼び出しに対するエラーチェックを使用してコードを生成します。

false

この値は既定値です。

生成された CUDA コードにエラーチェック機能は含まれません。

true

CUDA API やカーネルの呼び出しに対するエラーチェックを使用してコードを生成します。

例: cfg.GpuConfig.SafeBuild = true

`ComputeCapability` — コード生成に最低限の Compute Capability
`'3.5'` (既定値) | `'3.2'` | `'3.7'` | `'5.0'` | `'5.2'` | `'5.3'` | `'6.0'` | `'6.1'` | `'6.2'` | `'7.0'` | `'7.1'` | `'7.2'`

コード生成に最低限の Compute Capability を選択します。Compute Capability は、GPU ハードウェアでサポートされている機能を識別します。現在の GPU で利用できるハードウェア機能や命令を判断するために実行時のアプリケーションで使用されます。カスタム Compute Capability を指定すると、GPU Coder はこの設定を無視します。

コード生成のための CUDA Compute Capability の要件については、以下の表を参照してください。

Target	Compute Capability
CUDA MEX	GPU 計算の要件を参照してください。
ソースコード、スタティックライブラリ、ダイナミックライブラリ、および実行可能ファイル	3.2 以上。
8 ビット整数精度の深層学習アプリケーション	6.1、または 6.3 以上。
半精度 (16 ビット浮動小数点) の深層学習アプリケーション	5.3、6.0、または 6.2 以上。

例: cfg.GpuConfig.ComputeCapability = '6.1'

`CustomComputeCapability` — GPU コード生成の制御
`''` (既定値) | 文字ベクトル

それを対象に CUDA 入力ファイルをコンパイルしなければならない NVIDIA 仮想 GPU アーキテクチャの名前を指定します。

たとえば、仮想アーキテクチャタイプ -arch=compute_50 を指定します。-arch=sm_50 を使用すると、実際のアーキテクチャを指定できます。詳細については、CUDA Toolkit ドキュメンテーションの "Options for Steering GPU Code Generation" のトピックを参照してください。

例: cfg.GpuConfig.CustomComputeCapability = '-arch=compute_50'

`CompilerFlags` — GPU コンパイラへのフラグの追加
`''` (既定値) | `character vector`

GPU コンパイラに追加フラグを渡します。たとえば、--fmad=false は、nvcc コンパイラに対し、浮動小数点の乗算と加算を単一の浮動小数点積和演算 (FMAD) 命令へと縮約することを無効化するように指示します。

類似の NVIDIA コンパイラオプションについては、CUDA Toolkit ドキュメンテーションの "NVCC Command Options" のトピックを参照してください。

例: cfg.GpuConfig.CompilerFlags = '--fmad=false'

`StackLimitPerThread` — GPU スレッドあたりのスタックの制限
`1024` (既定値) | `integer`

GPU スレッドあたりの最大スタック制限を整数値で指定します。

例: cfg.GpuConfig.StackLimitPerThread = 1024

`MallocThreshold` — Malloc しきい値
`200` (既定値) | `integer`

整数で指定したサイズを超えると、にプライベート変数が、スタックではなくヒープに割り当てられるようにします。

例: cfg.GpuConfig.MallocThreshold = 256

`MaximumBlocksPerKernel` — カーネルの起動中に作成されるブロックの最大数
`0` (既定値) | `integer`

カーネルの起動中に作成されるブロックの最大数を指定します。

GPU デバイスのストリーミングマルチプロセッサ (SM) リソースは限られているため、各カーネルのブロック数を制限することで、ブロックのスケジューリング、ロード、およびアンロードによるパフォーマンスの低下を回避できます。

ループ内の反復回数がカーネルあたりの最大ブロック数よりも多い場合、コードジェネレーターはストライドを使用して CUDA カーネルを作成します。

各カーネルの最大ブロック数を指定すると、コードジェネレーターは 1 次元カーネルを作成します。コードジェネレーターに 2 次元カーネルまたは 3 次元カーネルを強制的に作成させるには、coder.gpu.kernel プラグマを使用します。coder.gpu.kernel プラグマは、各ブロックのカーネルの最大数よりも優先されます。

例: cfg.GpuConfig.MaximumBlocksPerKernel = 1024

`EnableMemoryManager` — GPU メモリマネージャーの使用
`false` (既定値) | `true`

効率的なメモリ割り当て、メモリ管理、および実行時のパフォーマンス向上のために、GPU メモリマネージャーを選択します。

値説明

値	説明
`true`	GPU メモリマネージャーは、大きな GPU メモリプールのコレクションを作成し、これらのプール内のメモリブロックのチャンクの割り当ておよび割り当て解除を管理します。大きなメモリプールを作成することにより、メモリマネージャは CUDA のメモリ API に対する呼び出し回数を減らして、実行時のパフォーマンスを向上させます。GPU メモリマネージャーは、MEX およびスタンドアロンの CUDA コード生成に使用できます。
`false`	メモリの割り当てと管理に GPU メモリマネージャーを使用しないようにします。この値は既定値です。

true

GPU メモリマネージャーは、大きな GPU メモリプールのコレクションを作成し、これらのプール内のメモリブロックのチャンクの割り当ておよび割り当て解除を管理します。大きなメモリプールを作成することにより、メモリマネージャは CUDA のメモリ API に対する呼び出し回数を減らして、実行時のパフォーマンスを向上させます。GPU メモリマネージャーは、MEX およびスタンドアロンの CUDA コード生成に使用できます。

false

メモリの割り当てと管理に GPU メモリマネージャーを使用しないようにします。

この値は既定値です。

例: cfg.GpuConfig.EnableMemoryManager = true

`BlockAlignment` — プール内のメモリブロックの配置の指定
`256` (既定値) | `positive integer`

GPU メモリマネージャーが使用するメモリブロックの配置を指定します。プール内のブロックサイズ (バイト) は、指定した値の倍数になります。BlockAlignment の値は 2 のべき乗でなければなりません。

例: cfg.GpuConfig.BlockAlignment = 1024

`FreeMode` — GPU メモリマネージャーがメモリを解放するタイミングの指定
`'Never'` (既定値) | `'AtTerminate'` | `'AfterAllocate'`

次の表のいずれかの値を使用して、メモリマネージャーが GPU デバイスのメモリを解放するタイミングを指定します。

値説明

値	説明
`'Never'`	メモリマネージャーが破棄されたときにメモリを解放します。この値は既定値です。
`'AtTerminate'`	生成コードで関数 `terminate` が呼び出されたときに、空の GPU プールを解放します。 MEX ターゲットの場合、生成された MEX 関数が呼び出されるたびにメモリを解放します。他のターゲットの場合、関数 terminate が呼び出されたときにメモリを解放します。
`'AfterAllocate'`	CUDA のメモリ割り当てが呼び出されるたびに空のプールを解放します。

'Never'

メモリマネージャーが破棄されたときにメモリを解放します。

この値は既定値です。

'AtTerminate'

生成コードで関数 terminate が呼び出されたときに、空の GPU プールを解放します。

MEX ターゲットの場合、生成された MEX 関数が呼び出されるたびにメモリを解放します。

他のターゲットの場合、関数 terminate が呼び出されたときにメモリを解放します。

'AfterAllocate'

CUDA のメモリ割り当てが呼び出されるたびに空のプールを解放します。

例: cfg.GpuConfig.FreeMode = 'AtTerminate'

`MinPoolSize` — GPU メモリマネージャーの最小プールサイズの指定
`8` (既定値) | `positive integer`

GPU メモリマネージャーの最小プールサイズをメガバイト (MB) 単位で指定します。MinPoolSize の値は 2 のべき乗でなければなりません。

メモリマネージャーは、MinPoolSize パラメーターと MaxPoolSize パラメーターを使用して、2 つの値の間を 2 のべき乗で内挿することにより、サイズレベルを計算します。たとえば、MinPoolSize が 4 で、MaxPoolSize が 1024 の場合、サイズレベルは {4, 8, 16, 32, 64, 128, 256, 512, 1024} になります。

例: cfg.GpuConfig.MinPoolSize = 32

`MaxPoolSize` — GPU メモリマネージャーの最大プールサイズの指定
`2048` (既定値) | `positive integer`

GPU メモリマネージャーの最大プールサイズをメガバイト (MB) 単位で指定します。MaxPoolSize の値は 2 のべき乗でなければなりません。

例: cfg.GpuConfig.MaxPoolSize = 4096

`SelectCudaDevice` — CUDA デバイスの選択
`-1` (既定値) | `deviceID`

NVIDIA Drive プラットフォームなどのマルチ GPU 環境で、ターゲットにする CUDA デバイスを指定します。

例: cfg.GpuConfig.SelectCudaDevice = <DeviceID>

メモ

gpuDevice および SelectCudaDevice が同じ GPU を指している場合のみ、SelectCudaDevice を gpuArray と共に使用できます。gpuDevice が別の GPU を指している場合、CUDA_ERROR_INVALID_VALUE ランタイムエラーがスローされます。

例

すべて折りたたむ

CUDA MEX の生成

GPU コード生成に適した MATLAB 関数から CUDA MEX 関数を生成します。また、コード生成レポートも有効にします。

MATLAB 関数 VecAdd を書き込みます。この関数は、入力 A および B のベクトル加算を実行します。

function [C] = VecAdd(A,B) %#codegen
    C = coder.nullcopy(zeros(size(A)));
    coder.gpu.kernelfun();
    C = A + B;
end

MEX 関数を生成するために、コード生成構成オブジェクトを作成します。

cfg = coder.gpuConfig('mex');

コード生成レポートを有効にします。

cfg.GpuConfig.EnableCUBLAS = true;
cfg.GenerateReport = true;

-config オプションを使って構成オブジェクトを指定して、現在のフォルダーに MEX 関数を生成します。

% Generate a MEX function and code generation report
codegen -config cfg -args {zeros(512,512,'double'),zeros(512,512,'double')} VecAdd

制限

GPU Coder は、コード構成オブジェクト coder.CodeConfig と coder.EmbeddedCodeConfig の PassStructByReference プロパティを true に設定します。
GPU Coder は、コード構成オブジェクト coder.EmbeddedCodeConfig の EnableSignedLeftShifts プロパティと EnableSignedRightShifts プロパティを true に設定します。
スタティックライブラリ、ダイナミックリンクライブラリ、または Windows^® 環境の実行可能プログラムなどのスタンドアロンターゲットの場合、生成された makefile は /MT または /MD コンパイラフラグを設定しません。これらのフラグは、マルチスレッドライブラリを使用するように Visual Studio コンパイラに指示するものです。既定では、Visual Studio はコンパイル時に /MT を使用します。他のコンパイラ固有フラグを渡すには、CompilerFlags オプションを使用します。次に例を示します。
```
cfg.GpuConfig.CompilerFlags = '-Xcompiler /MD';
```
nvcc コンパイラには、入力ファイルのサフィックスに制限があります。たとえば、オブジェクトファイルにバージョン番号が含まれている場合、コンパイルが失敗する可能性があります。このような場合は、シンボリックリンクを作成するか、'-Xlinker' を CompilerFlags に渡します。

バージョン履歴

R2017b で導入

すべて展開する

R2021a: ホストでの `unified` メモリ割り当てモードは削除予定

ホスト開発コンピューター上の NVIDIA GPU デバイスをターゲットとする場合のユニファイドメモリ割り当て (cudaMallocManaged) モードは、将来のリリースで削除される予定です。NVIDIA 組み込みプラットフォームをターゲットとする場合は、引き続きユニファイドメモリ割り当てモードを使用できます。

MATLAB からホストの CUDA コードを生成する場合は、coder.gpuConfig コード構成オブジェクトの MallocMode プロパティを 'discrete' に設定します。

参考

coder.gpuConfig

説明

作成

構文

説明

入力引数

build_type — 生成された CUDA コードからビルドする出力 'MEX' | 'LIB' | 'DLL' | 'EXE'

プロパティ

Enabled — GPU コード生成の制御 true (既定値) | false

MallocMode — GPU メモリの割り当て 'discrete' (既定値) | 'unified'

KernelNamePrefix — カスタムのカーネル名の接頭辞 ' ' (既定値) | 文字ベクトル

EnableCUBLAS — cuBLAS ライブラリの使用 true (既定値) | false

EnableCUSOLVER — cuSOLVER ライブラリの使用 true (既定値) | false

EnableCUFFT — cuFFT ライブラリの使用 true (既定値) | false

Benchmarking — 生成コードへのベンチマークの追加 false (既定値) | true

SafeBuild — 生成されたコードのエラー チェック false (既定値) | true

ComputeCapability — コード生成に最低限の Compute Capability '3.5' (既定値) | '3.2' | '3.7' | '5.0' | '5.2' | '5.3' | '6.0' | '6.1' | '6.2' | '7.0' | '7.1' | '7.2'

CustomComputeCapability — GPU コード生成の制御 '' (既定値) | 文字ベクトル

CompilerFlags — GPU コンパイラへのフラグの追加 '' (既定値) | character vector

StackLimitPerThread — GPU スレッドあたりのスタックの制限 1024 (既定値) | integer

MallocThreshold — Malloc しきい値 200 (既定値) | integer

MaximumBlocksPerKernel — カーネルの起動中に作成されるブロックの最大数 0 (既定値) | integer

EnableMemoryManager — GPU メモリ マネージャーの使用 false (既定値) | true

BlockAlignment — プール内のメモリ ブロックの配置の指定 256 (既定値) | positive integer

FreeMode — GPU メモリ マネージャーがメモリを解放するタイミングの指定 'Never' (既定値) | 'AtTerminate' | 'AfterAllocate'

MinPoolSize — GPU メモリ マネージャーの最小プール サイズの指定 8 (既定値) | positive integer

MaxPoolSize — GPU メモリ マネージャーの最大プール サイズの指定 2048 (既定値) | positive integer

SelectCudaDevice — CUDA デバイスの選択 -1 (既定値) | deviceID

例

CUDA MEX の生成

制限

バージョン履歴

R2021a: ホストでの unified メモリ割り当てモードは削除予定

参考

アプリ

関数

オブジェクト

トピック

`build_type` — 生成された CUDA コードからビルドする出力
`'MEX'` | `'LIB'` | `'DLL'` | `'EXE'`

`Enabled` — GPU コード生成の制御
`true` (既定値) | `false`

`MallocMode` — GPU メモリの割り当て
`'discrete'` (既定値) | `'unified'`

`KernelNamePrefix` — カスタムのカーネル名の接頭辞
' ' (既定値) | 文字ベクトル

`EnableCUBLAS` — `cuBLAS` ライブラリの使用
`true` (既定値) | `false`

`EnableCUSOLVER` — `cuSOLVER` ライブラリの使用
`true` (既定値) | `false`

`EnableCUFFT` — `cuFFT` ライブラリの使用
`true` (既定値) | `false`

`Benchmarking` — 生成コードへのベンチマークの追加
`false` (既定値) | `true`

`SafeBuild` — 生成されたコードのエラーチェック
`false` (既定値) | `true`

`ComputeCapability` — コード生成に最低限の Compute Capability
`'3.5'` (既定値) | `'3.2'` | `'3.7'` | `'5.0'` | `'5.2'` | `'5.3'` | `'6.0'` | `'6.1'` | `'6.2'` | `'7.0'` | `'7.1'` | `'7.2'`

`CustomComputeCapability` — GPU コード生成の制御
`''` (既定値) | 文字ベクトル

`CompilerFlags` — GPU コンパイラへのフラグの追加
`''` (既定値) | `character vector`

`StackLimitPerThread` — GPU スレッドあたりのスタックの制限
`1024` (既定値) | `integer`

`MallocThreshold` — Malloc しきい値
`200` (既定値) | `integer`

`MaximumBlocksPerKernel` — カーネルの起動中に作成されるブロックの最大数
`0` (既定値) | `integer`

`EnableMemoryManager` — GPU メモリマネージャーの使用
`false` (既定値) | `true`

`BlockAlignment` — プール内のメモリブロックの配置の指定
`256` (既定値) | `positive integer`

`FreeMode` — GPU メモリマネージャーがメモリを解放するタイミングの指定
`'Never'` (既定値) | `'AtTerminate'` | `'AfterAllocate'`

`MinPoolSize` — GPU メモリマネージャーの最小プールサイズの指定
`8` (既定値) | `positive integer`

`MaxPoolSize` — GPU メモリマネージャーの最大プールサイズの指定
`2048` (既定値) | `positive integer`

`SelectCudaDevice` — CUDA デバイスの選択
`-1` (既定値) | `deviceID`

R2021a: ホストでの `unified` メモリ割り当てモードは削除予定