ネットワーク圧縮入門
Deep Learning Toolbox™ Model Compression Library の基礎を学習する
Deep Learning Toolbox を Deep Learning Toolbox Model Compression Library サポート パッケージと共に使用し、以下を行うことで、深層ニューラル ネットワークのメモリ フットプリントの削減と計算要件の緩和を行います。
1 次テイラー近似を使用して畳み込み層からフィルターを枝刈りする。
層の活性化に対し、主成分分析 (PCA) を実行して層を投影する。
層の重み、バイアス、および活性化を、低い精度にスケーリングされた整数データ型に量子化する。
その後、圧縮されたネットワークからコードを生成し、目的のハードウェアに展開できます。
トピック
- Reduce Memory Footprint of Deep Neural Networks
Learn about neural network compression techniques, including pruning, projection, and quantization.



