メインコンテンツ

ネットワーク圧縮入門

Deep Learning Toolbox™ Model Compression Library の基礎を学習する

Deep Learning Toolbox を Deep Learning Toolbox Model Compression Library サポート パッケージと共に使用し、以下を行うことで、深層ニューラル ネットワークのメモリ フットプリントの削減と計算要件の緩和を行います。

  • 1 次テイラー近似を使用して畳み込み層からフィルターを枝刈りする。

  • 層の活性化に対し、主成分分析 (PCA) を実行して層を投影する。

  • 層の重み、バイアス、および活性化を、低い精度にスケーリングされた整数データ型に量子化する。

その後、圧縮されたネットワークからコードを生成し、目的のハードウェアに展開できます。

Diagram of suggested compression workflow: first pruning, then projection, then quantization, then code generation.

トピック

注目の例