データ型 (TensorRT)

推論計算の精度

説明

アプリ構成ペイン: 深層学習

構成オブジェクト: coder.TensorRTConfig

サポートされている層で推論計算の精度を指定します。32 ビット浮動小数点の推論を実行する場合、'fp32' を使用します。半精度には、'fp16' を使用します。8 ビット整数には、'int8' を使用します。既定値は 'fp32' です。

INT8 精度を使用するには、Compute Capability が 6.1、7.0、またはそれ以上の CUDA^® GPU が必要です。Compute Capability 6.2 では INT8 精度はサポートされません。FP16 精度を使用するには、Compute Capability が 5.3、6.0、6.2、またはそれ以上の CUDA GPU が必要です。[最低 Compute Capability] を version 5.3、6.0、6.2、またはそれ以上に設定してください。

TensorRT を使用したロゴ分類ネットワークに対して 8 ビット整数で予測を実行する例については、NVIDIA TensorRT ライブラリを使用した深層学習予測を参照してください。

依存関係

このパラメーターを有効にするには、[深層学習ライブラリ] を [TensorRT] に設定しなければなりません。

設定

fp32

この設定は既定の設定です。

推論計算は 32 ビット浮動小数点数で行われます。

fp16

この設定は既定の設定です。

推論計算は 16 ビット浮動小数点数で行われます。

int8

推論計算は 8 ビット整数で行われます。

プログラムでの使用

プロパティ: DataType

値: 'fp32' | 'fp16' | 'int8'

既定の設定: 'fp32'

バージョン履歴

R2018b で導入

参考

coder.TensorRTConfig

トピック

NVIDIA TensorRT ライブラリを使用した深層学習予測