cnncodegen

ARM Mali GPU プロセッサをターゲットとする深層学習ネットワークのコードの生成

構文

cnncodegen(net,'targetlib','arm-compute-mali')

cnncodegen(net,'targetlib','arm-compute-mali',targetparams)

説明

cnncodegen(net,'targetlib','arm-compute-mali') は、Mali GPU 用の ARM^® Compute Library を使用して、指定されたネットワークオブジェクトの C++ コードを生成します。

GPU Coder™ 製品と GPU Coder Interface for Deep Learning が必要です。

cnncodegen(net,'targetlib','arm-compute-mali',targetparams) は、追加のコード生成オプションと共に Mali GPU 用の ARM Compute Library を使用して、指定されたネットワークオブジェクトの C++ コードを生成します。

例

すべて折りたたむ

ARM プロセッサで実行する事前学習済みネットワークの C++ コードの生成

cnncodegen を使用して ARM Mali グラフィックスプロセッサに展開するための事前学習済みネットワークの C++ コードを生成します。

関数 googlenet (Deep Learning Toolbox) を使用して事前学習済みの GoogLeNet モデルを取得します。この関数には、Deep Learning Toolbox™ Model for GoogLeNet Network が必要です。このサポートパッケージをインストールしていない場合、関数によってダウンロード用リンクが表示されます。または、https://www.mathworks.com/matlabcentral/fileexchange/64456-deep-learning-toolbox-model-for-googlenet-networkを参照してください。

net = googlenet;

cnncodegen を使用し、'targetlib' を 'arm-compute-mali' に設定してコードを生成します。既定では、コードジェネレーターは ARM のバージョン '19.05' をターゲットにします。別のバージョンの Compute Library をターゲットにするには、'ArmComputeVersion' パラメーターを使用します。

cnncodegen(net,'targetlib','arm-compute-mali'...
,'targetparams',struct('ArmComputeVersion','19.02'));

------------------------------------------------------------------------
Compilation suppressed: generating code only.
------------------------------------------------------------------------
### Codegen Successfully Generated for arm device

コードジェネレーターは、'/pwd/codegen' フォルダーに .cpp ファイルとヘッダーファイルを生成します。DAG ネットワークは、87 個の層クラスから成る配列を含む CnnMain という名前の C++ クラスとして生成されます。コードジェネレーターは畳み込み層とバッチ正規化層のレイヤーフュージョン最適化で層の数を削減します。このクラスの setup() メソッドは、ハンドルを設定し、各層オブジェクトにリソースを割り当てます。predict() メソッドは、ネットワーク内の 87 個の層それぞれについて予測を呼び出します。cleanup() メソッドは、各層オブジェクトに割り当てられたすべてのメモリとシステムのリソースを解放します。ネットワークの畳み込み層のバイナリ重み (cnn_**_w) およびバイアスファイル (cnn_**_b) はすべて、codegen フォルダーに保存されます。

ライブラリをビルドするには、生成されたコードを ARM ターゲットプラットフォームに移動して、生成された makefile cnnbuild_rtw.mk を使用します。

入力引数

すべて折りたたむ

`net` — 事前学習済みの深層学習ネットワークオブジェクト
文字ベクトル | string スカラー

事前学習済みの SeriesNetwork または DAGNetwork オブジェクト。

メモ

cnncodegen は dlnetwork オブジェクトをサポートしません。

`targetparams` — ライブラリ固有のパラメーター
構造体

ARM Compute Library 固有のパラメーター。次の表で説明するフィールドを含む 1 行 1 列の構造体として指定します。

フィールド	説明
`ArmComputeVersion`	ターゲットハードウェア上の ARM Compute Library のバージョン。`'19.02'` または `'19.05'` として指定します。既定値は `'19.05'` です。`ArmComputeVersion` を `'19.05'` 以降のバージョンに設定した場合でも、`ArmComputeVersion` は `'19.05'` に設定されます。

バージョン履歴

R2017b で導入

すべて展開する

R2021a: ターゲットライブラリのサポートに対する変更

R2021b 以降、関数 cnncodegen は、コンピュータービジョンおよび機械学習用の ARM Compute Library を使用して、ARM Mali GPU プロセッサ専用のスタティックライブラリをビルドするための C++ コードと makefile を生成します。

他のすべてのターゲットには、codegen コマンドを使用します。関数 coder.loadDeepLearningNetwork を使用して深層学習モデルを読み込み、predict (Deep Learning Toolbox) を呼び出して応答を予測するエントリポイント関数を MATLAB^® で記述します。次に例を示します。

function out = googlenet_predict(in) %#codegen

persistent mynet;

if isempty(mynet)
    mynet = coder.loadDeepLearningNetwork('googlenet');
end

% pass in input   
out = predict(mynet,in);

cnncodegen の代表的な使用法と、代わりに codegen を使用するためのコードの更新方法を、次の表に示します。

ターゲットワークフロー非推奨推奨

ターゲットワークフロー	非推奨	推奨
`NEON` 命令をサポートする ARM CPU プロセッサ	`'targetlib'` パラメーターを `'arm-compute'` に設定します。`'targetparams'` パラメーターを使用して、コード生成の対象とする ARM Compute Library のバージョンとターゲットハードウェアの ARM アーキテクチャを指定します。 cnncodegen(net,'targetlib'... ,'arm-compute','targetparams' ... ,struct('ArmComputeVersion'... ,'19.02','ArmArchitecture'... ,'armv8')) ARM Compute Library でサポートされている他のバージョンは、`'18.11'`、`'19.02'`、`'19.05'`、または `'20.02.1'` です。既定値は `'20.02.1'` です。`ArmComputeVersion` を `'20.02.1'` 以降のバージョンに設定した場合でも、`ArmComputeVersion` は `'20.02.1'` に設定されます。 ARM アーキテクチャには、`'armv7` または `'armv8'` を指定できます。指定したアーキテクチャは、ターゲットハードウェア上の ARM Compute Library のアーキテクチャと同じでなければなりません。	スタティックライブラリを生成するための `coder.config` 構成オブジェクトを作成します。 cfg = coder.config('lib'); cfg.TargetLang = 'C++'; `coder.ARMNEONConfig` 深層学習構成オブジェクトを作成します。深層学習構成オブジェクトのターゲットライブラリの固有のプロパティを指定します。これを `cfg` 構成オブジェクトの `DeepLearningConfig` プロパティに割り当てます。 dlcfg = coder.DeepLearningConfig ... ('arm-compute'); dlcfg.ArmArchitecture = 'armv8'; dlcfg.ArmComputeVersion = '19.02'; cfg.DeepLearningConfig = dlcfg; 関数 `codegen` の `-config` オプションを使用して `cfg` 構成オブジェクトを指定します。関数 `codegen` は、MATLAB 関数入力のサイズ、クラス、および実数/複素数を決定しなければなりません。`-args` オプションを使用して、エントリポイント関数の入力のサイズを指定します。 arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict 詳細については、ARM Compute Library を使用した、深層学習ネットワークのためのコード生成を参照してください。
CUDA^® Deep Neural Network library (cuDNN) を使用する NVIDIA^® GPU	`'targetlib'` パラメーターを `'cudnn'` に設定します。`'targetparams'` パラメーターを使用して、cuDNN ライブラリ固有のプロパティを指定します。 cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability'... ,'7.0','targetparams' ... ,struct('AutoTuning',true ... ,'DataType','INT8'... ,'CalibrationResultFile' ... 'myInt8Cal.mat')) 自動調整の機能により、cuDNN ライブラリで最速の畳み込みアルゴリズムを見つけられるようになります。 `'DataType'` パラメーターは、サポートされている層で推論計算の精度を指定します。32 ビット浮動小数点の推論を実行する場合、`'FP32'` を使用します。	スタティックライブラリを生成するための `coder.gpuConfig` 構成オブジェクトを作成します。 cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; コード生成に最低限の Compute Capability を設定するには、GPU コード構成オブジェクトの `ComputeCapability` プロパティを使用します。 cfg.GpuConfig.ComputeCapability = '7.0'; `coder.CuDNNConfig` 深層学習構成オブジェクトを作成します。深層学習構成オブジェクトのターゲットライブラリの固有のプロパティを指定します。これを `cfg` 構成オブジェクトの `DeepLearningConfig` プロパティに割り当てます。 dlcfg = coder.DeepLearningConfig('cudnn'); dlcfg.AutoTuning = true; dlcfg.DataType = 'int8'; dlcfg.CalibrationResultFile = 'myInt8Cal.mat'; cfg.DeepLearningConfig = dlcfg; 関数 `codegen` の `-config` オプションを使用して `cfg` 構成オブジェクトを指定します。関数 `codegen` は、MATLAB 関数入力のサイズ、クラス、および実数/複素数を決定しなければなりません。`-args` オプションを使用して、エントリポイント関数の入力のサイズを指定します。 arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict 詳細については、cuDNN を使用した深層学習ネットワークのコード生成を参照してください。
Intel^® CPU プロセッサ	Intel CPU 用の Intel Math Kernel Library for Deep Neural Networks (MKL-DNN) を使用するには、`'targetlib'` パラメーターを `'mkldnn'` に設定します。 cnncodegen(net,'targetlib'... ,'mkldnn');	スタティックライブラリを生成するための `coder.config` 構成オブジェクトを作成します。 cfg = coder.config('lib'); cfg.TargetLang = 'C++'; `coder.MklDNNConfig` 深層学習構成オブジェクトを作成します。これを `cfg` 構成オブジェクトの `DeepLearningConfig` プロパティに割り当てます。 dlcfg = coder.DeepLearningConfig... ('mkldnn'); cfg.DeepLearningConfig = dlcfg; 関数 `codegen` の `-config` オプションを使用して `cfg` 構成オブジェクトを指定します。関数 `codegen` は、MATLAB 関数入力のサイズ、クラス、および実数/複素数を決定しなければなりません。`-args` オプションを使用して、エントリポイント関数の入力のサイズを指定します。 arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict 詳細については、MKL-DNN を使用した、深層学習ネットワークのためのコード生成を参照してください。
高性能な深層学習用推論オプティマイザーおよびランタイムライブラリである NVIDIA TensorRT™ を使用する NVIDIA GPU	`'targetlib'` パラメーターを `'tensorrt'` に設定します。`'targetparams'` パラメーターを使用して、TensorRT ライブラリ固有のプロパティを指定します。 cnncodegen(net,'targetlib'... ,'tensorrt','ComputeCapability'... ,'7.0','targetparams' ... ,struct('DataType','INT8' ... 'DataPath','image_dataset'... ,'NumCalibrationBatches',50))	スタティックライブラリを生成するための `coder.gpuConfig` 構成オブジェクトを作成します。 cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; コード生成に最低限の Compute Capability を設定するには、GPU コード構成オブジェクトの `ComputeCapability` プロパティを使用します。 cfg.GpuConfig.ComputeCapability = '7.0'; `coder.TensorRTConfig` 深層学習構成オブジェクトを作成します。深層学習構成オブジェクトのターゲットライブラリの固有のプロパティを指定します。これを `cfg` 構成オブジェクトの `DeepLearningConfig` プロパティに割り当てます。 dlcfg = coder.DeepLearningConfig... ('cudnn'); dlcfg.DataType = 'int8'; dlcfg.DataPath = 'image_dataset'; dlcfg.NumCalibrationBatches = 50; cfg.DeepLearningConfig = dlcfg; 関数 `codegen` の `-config` オプションを使用して `cfg` 構成オブジェクトを指定します。関数 `codegen` は、MATLAB 関数入力のサイズ、クラス、および実数/複素数を決定しなければなりません。`-args` オプションを使用して、エントリポイント関数の入力のサイズを指定します。 arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict 詳細については、NVIDIA TensorRT ライブラリを使用した深層学習予測を参照してください。
一般オプション	makefile の生成やビルドを行わずにコードを生成します。次に例を示します。 cnncodegen(net,'targetlib' ... ,'mkldnn','codegenonly',1);	make コマンドを呼び出したりオブジェクトコードをビルドしたりせずにソースコードを生成するには、`coder.CodeConfig` または `coder.GPUCodeConfig` オブジェクトの `GenCodeOnly` プロパティを使用します。次に例を示します。 cfg = coder.codeConfig('lib'); cfg.GenCodeOnly = true;
コンパイルの対象とする NVIDIA GPU Compute Capability の指定。引数は `major#.minor#` の形式になります。 cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability','7.0');	コード生成に最低限の Compute Capability を設定するには、GPU コード構成オブジェクトの `ComputeCapability` プロパティを使用します。 cfg = coder.gpuConfig('lib'); cfg.GpuConfig.ComputeCapability = '7.0';

NEON 命令をサポートする ARM CPU プロセッサ

'targetlib' パラメーターを 'arm-compute' に設定します。'targetparams' パラメーターを使用して、コード生成の対象とする ARM Compute Library のバージョンとターゲットハードウェアの ARM アーキテクチャを指定します。

cnncodegen(net,'targetlib'...
,'arm-compute','targetparams' ...
,struct('ArmComputeVersion'...
,'19.02','ArmArchitecture'...
,'armv8'))

ARM Compute Library でサポートされている他のバージョンは、'18.11'、'19.02'、'19.05'、または '20.02.1' です。既定値は '20.02.1' です。ArmComputeVersion を '20.02.1' 以降のバージョンに設定した場合でも、ArmComputeVersion は '20.02.1' に設定されます。

ARM アーキテクチャには、'armv7 または 'armv8' を指定できます。指定したアーキテクチャは、ターゲットハードウェア上の ARM Compute Library のアーキテクチャと同じでなければなりません。

スタティックライブラリを生成するための coder.config 構成オブジェクトを作成します。

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

coder.ARMNEONConfig 深層学習構成オブジェクトを作成します。深層学習構成オブジェクトのターゲットライブラリの固有のプロパティを指定します。これを cfg 構成オブジェクトの DeepLearningConfig プロパティに割り当てます。

dlcfg = coder.DeepLearningConfig ...
('arm-compute');
dlcfg.ArmArchitecture = 'armv8';
dlcfg.ArmComputeVersion = '19.02';
cfg.DeepLearningConfig = dlcfg;

関数 codegen の -config オプションを使用して cfg 構成オブジェクトを指定します。関数 codegen は、MATLAB 関数入力のサイズ、クラス、および実数/複素数を決定しなければなりません。-args オプションを使用して、エントリポイント関数の入力のサイズを指定します。

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

詳細については、ARM Compute Library を使用した、深層学習ネットワークのためのコード生成を参照してください。

CUDA^® Deep Neural Network library (cuDNN) を使用する NVIDIA^® GPU

'targetlib' パラメーターを 'cudnn' に設定します。'targetparams' パラメーターを使用して、cuDNN ライブラリ固有のプロパティを指定します。

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability'...
,'7.0','targetparams' ...
,struct('AutoTuning',true ...
,'DataType','INT8'...
,'CalibrationResultFile' ...
'myInt8Cal.mat'))

自動調整の機能により、cuDNN ライブラリで最速の畳み込みアルゴリズムを見つけられるようになります。

'DataType' パラメーターは、サポートされている層で推論計算の精度を指定します。32 ビット浮動小数点の推論を実行する場合、'FP32' を使用します。

スタティックライブラリを生成するための coder.gpuConfig 構成オブジェクトを作成します。

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

コード生成に最低限の Compute Capability を設定するには、GPU コード構成オブジェクトの ComputeCapability プロパティを使用します。

cfg.GpuConfig.ComputeCapability = '7.0';

coder.CuDNNConfig 深層学習構成オブジェクトを作成します。深層学習構成オブジェクトのターゲットライブラリの固有のプロパティを指定します。これを cfg 構成オブジェクトの DeepLearningConfig プロパティに割り当てます。

dlcfg = coder.DeepLearningConfig('cudnn');
dlcfg.AutoTuning = true;
dlcfg.DataType = 'int8';
dlcfg.CalibrationResultFile = 'myInt8Cal.mat';
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

詳細については、cuDNN を使用した深層学習ネットワークのコード生成を参照してください。

Intel^® CPU プロセッサ

Intel CPU 用の Intel Math Kernel Library for Deep Neural Networks (MKL-DNN) を使用するには、'targetlib' パラメーターを 'mkldnn' に設定します。

cnncodegen(net,'targetlib'...
,'mkldnn');

スタティックライブラリを生成するための coder.config 構成オブジェクトを作成します。

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

coder.MklDNNConfig 深層学習構成オブジェクトを作成します。これを cfg 構成オブジェクトの DeepLearningConfig プロパティに割り当てます。

dlcfg = coder.DeepLearningConfig...
('mkldnn');
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

詳細については、MKL-DNN を使用した、深層学習ネットワークのためのコード生成を参照してください。

高性能な深層学習用推論オプティマイザーおよびランタイムライブラリである NVIDIA TensorRT™ を使用する NVIDIA GPU

'targetlib' パラメーターを 'tensorrt' に設定します。'targetparams' パラメーターを使用して、TensorRT ライブラリ固有のプロパティを指定します。

cnncodegen(net,'targetlib'...
,'tensorrt','ComputeCapability'...
,'7.0','targetparams' ...
,struct('DataType','INT8' ...
'DataPath','image_dataset'...
,'NumCalibrationBatches',50))

スタティックライブラリを生成するための coder.gpuConfig 構成オブジェクトを作成します。

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

コード生成に最低限の Compute Capability を設定するには、GPU コード構成オブジェクトの ComputeCapability プロパティを使用します。

cfg.GpuConfig.ComputeCapability = '7.0';

coder.TensorRTConfig 深層学習構成オブジェクトを作成します。深層学習構成オブジェクトのターゲットライブラリの固有のプロパティを指定します。これを cfg 構成オブジェクトの DeepLearningConfig プロパティに割り当てます。

dlcfg = coder.DeepLearningConfig...
('cudnn');
dlcfg.DataType = 'int8';
dlcfg.DataPath = 'image_dataset';
dlcfg.NumCalibrationBatches = 50;
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

詳細については、NVIDIA TensorRT ライブラリを使用した深層学習予測を参照してください。

一般オプション

makefile の生成やビルドを行わずにコードを生成します。次に例を示します。

cnncodegen(net,'targetlib' ...
,'mkldnn','codegenonly',1);

make コマンドを呼び出したりオブジェクトコードをビルドしたりせずにソースコードを生成するには、coder.CodeConfig または coder.GPUCodeConfig オブジェクトの GenCodeOnly プロパティを使用します。次に例を示します。

cfg = coder.codeConfig('lib');
cfg.GenCodeOnly = true;

コンパイルの対象とする NVIDIA GPU Compute Capability の指定。引数は major#.minor# の形式になります。

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability','7.0');

コード生成に最低限の Compute Capability を設定するには、GPU コード構成オブジェクトの ComputeCapability プロパティを使用します。

cfg = coder.gpuConfig('lib');
cfg.GpuConfig.ComputeCapability = '7.0';

参考

関数

codegen | coder.loadDeepLearningNetwork

cnncodegen

構文

説明

例

ARM プロセッサで実行する事前学習済みネットワークの C++ コードの生成

入力引数

net — 事前学習済みの深層学習ネットワーク オブジェクト 文字ベクトル | string スカラー

targetparams — ライブラリ固有のパラメーター 構造体

バージョン履歴

R2021a: ターゲット ライブラリのサポートに対する変更

参考

関数

トピック

`net` — 事前学習済みの深層学習ネットワークオブジェクト
文字ベクトル | string スカラー

`targetparams` — ライブラリ固有のパラメーター
構造体

R2021a: ターゲットライブラリのサポートに対する変更