データ型 (TensorRT)
推論計算の精度
説明
アプリ構成ペイン: 深層学習
構成オブジェクト: coder.TensorRTConfig
サポートされている層で推論計算の精度を指定します。32 ビット浮動小数点の推論を実行する場合、'fp32' を使用します。半精度には、'fp16' を使用します。8 ビット整数には、'int8' を使用します。既定値は 'fp32' です。
INT8 精度を使用するには、Compute Capability が 6.1、7.0、またはそれ以上の CUDA® GPU が必要です。Compute Capability 6.2 では INT8 精度はサポートされません。FP16 精度を使用するには、Compute Capability が 5.3、6.0、6.2、またはそれ以上の CUDA GPU が必要です。[最低 Compute Capability] を version 5.3、6.0、6.2、またはそれ以上に設定してください。
TensorRT を使用したロゴ分類ネットワークに対して 8 ビット整数で予測を実行する例については、NVIDIA TensorRT ライブラリを使用した深層学習予測を参照してください。
依存関係
このパラメーターを有効にするには、[深層学習ライブラリ] を [TensorRT] に設定しなければなりません。
設定
fp32この設定は既定の設定です。
推論計算は 32 ビット浮動小数点数で行われます。
fp16この設定は既定の設定です。
推論計算は 16 ビット浮動小数点数で行われます。
int8推論計算は 8 ビット整数で行われます。
プログラムでの使用
プロパティ: DataType |
値: 'fp32' | 'fp16' | 'int8' |
既定の設定: 'fp32' |
バージョン履歴
R2018b で導入