枝刈り、投影、および量子化
深層ニューラル ネットワークを圧縮し、ネットワーク メモリを削減し、コード生成用にネットワークを準備する
Deep Learning Toolbox™ を Deep Learning Toolbox Model Compression Library サポート パッケージと共に使用し、以下を行うことで、深層ニューラル ネットワークのメモリ フットプリントの削減と計算要件の緩和を行います。
1 次テイラー近似を使用して畳み込み層からフィルターを枝刈りする。
層の活性化に対し、主成分分析 (PCA) を実行して層を投影する。
層の重み、バイアス、および活性化を、低い精度にスケーリングされた整数データ型に量子化する。
その後、圧縮されたネットワークからコードを生成し、目的のハードウェアに展開できます。
カテゴリ
- ネットワーク圧縮入門
Deep Learning Toolbox Model Compression Library の基礎を学習する
- 枝刈り
1 次テイラー近似を使用してネットワーク フィルターを枝刈りし、学習可能なパラメーターの数を減らす
- 投影
主成分分析 (PCA) を使用してネットワーク層を投影し、学習可能なパラメーターの数を減らす
- 量子化
ネットワーク パラメーターを低い精度のデータ型に量子化し、固定小数点コード生成用に深層学習ネットワークを準備する
- ネットワーク圧縮の用途
エンドツーエンドのワークフローにおける深層学習モデルの圧縮について調査する



