メインコンテンツ

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

coder.TensorRTConfig

NVIDIA TensorRT ライブラリによる深層学習コード生成を構成するためのパラメーター

説明

coder.TensorRTConfig オブジェクトには、NVIDIA® の高性能な深層学習用推論オプティマイザーおよびランタイム ライブラリ (TensorRT) 固有のパラメーターが含まれています。codegen は、深層ニューラル ネットワークの CUDA® コード生成にこれらのパラメーターを使用します。

コード生成に coder.TensorRTConfig オブジェクトを使用するには、これを、codegen に渡す coder.gpuConfig オブジェクトの DeepLearningConfig プロパティに割り当てます。

作成

ターゲット ライブラリを 'tensorrt' に設定して関数 coder.DeepLearningConfig を使用し、TensorRT 構成オブジェクトを作成します。

プロパティ

すべて展開する

サポートされている層で推論計算の精度を指定します。詳細については、Data type (TensorRT)を参照してください。

再キャリブレーション中に使用されるイメージ データセットの位置。このオプションは、DataType'int8' に設定されている場合にのみ適用できます。詳細については、Calibration data pathを参照してください。

int8 のキャリブレーション バッチの数を指定する数値。このオプションは、DataType'int8' に設定されている場合にのみ適用できます。詳細については、キャリブレーション バッチの数を参照してください。

読み取り専用の値。ターゲット ライブラリ名を指定します。

すべて折りたたむ

imagePretrainedNetwork 関数を使用して ResNet-50 ネットワークを含む dlnetwork オブジェクトを読み込むエントリポイント関数 resnet_predict を作成します。詳細については、dlarray 用のコード生成を参照してください。

function out = resnet_predict(in)

dlIn = dlarray(in, 'SSCB');
persistent dlnet;
if isempty(dlnet)
    dlnet = imagePretrainedNetwork('resnet50');
end

dlOut = predict(dlnet, dlIn);
out = extractdata(dlOut);

MEX コード生成用の coder.gpuConfig 構成オブジェクトを作成します。

cfg = coder.gpuConfig('mex');

ターゲット言語を C++ に設定します。

cfg.TargetLang = 'C++';

coder.TensorRTConfig 深層学習構成オブジェクトを作成します。これを cfg 構成オブジェクトの DeepLearningConfig プロパティに割り当てます。

cfg.DeepLearningConfig = coder.DeepLearningConfig('tensorrt');

関数 codegen-config オプションを使用して cfg 構成オブジェクトを渡します。関数 codegen は、MATLAB® 関数入力のサイズ、クラス、および実数/複素数を決定しなければなりません。-args オプションを使用して、エントリポイント関数の入力のサイズを指定します。

codegen -args {ones(224,224,3,'single')} -config cfg resnet_predict;

codegen コマンドはすべての生成されたファイルを codegen フォルダーに配置します。このフォルダーには、エントリポイント関数 resnet_predict.cu の CUDA コード、ヘッダー ファイル、畳み込みニューラル ネットワーク (CNN) の C++ クラス定義を含むソース ファイル、重みファイル、およびバイアス ファイルが含まれます。

バージョン履歴

R2018b で導入

すべて展開する