ネットワーク圧縮入門

Deep Learning Toolbox™ Model Compression Library の基礎を学習する

Deep Learning Toolbox を Deep Learning Toolbox Model Compression Library サポートパッケージと共に使用し、以下を行うことで、深層ニューラルネットワークのメモリフットプリントの削減と計算要件の緩和を行います。

1 次テイラー近似を使用して畳み込み層からフィルターを枝刈りする。
層の活性化に対し、主成分分析 (PCA) を実行して層を投影する。
層の重み、バイアス、および活性化を、低い精度にスケーリングされた整数データ型に量子化する。

その後、圧縮されたネットワークからコードを生成し、目的のハードウェアに展開できます。

Diagram of suggested compression workflow: first pruning, then projection, then quantization, then code generation.

トピック

Reduce Memory Footprint of Deep Neural Networks
Learn about neural network compression techniques, including pruning, projection, and quantization.

注目の例

Analyze and Compress 1-D Convolutional Neural Network

Analyze and Compress 1-D Convolutional Neural Network

Analyze 1-D convolutional network for compression and compress it using Taylor pruning and projection.

R2024b 以降
ライブスクリプトを開く

Export Quantized Networks to Simulink and Generate Code

Export Quantized Networks to Simulink and Generate Code

Export a quantized neural network to Simulink and generate code from the exported model.

ライブスクリプトを開く

イメージ分類ネットワークのパラメーターの枝刈りと量子化

イメージ分類ネットワークのパラメーターの枝刈りと量子化

パラメーターの枝刈りと量子化を行ってネットワークのサイズを小さくする。

ライブスクリプトを開く