メインコンテンツ

枝刈り

1 次テイラー近似を使用してネットワーク フィルターを枝刈りし、学習可能なパラメーターの数を減らす

1 次テイラー近似を使用して畳み込み層からフィルターを枝刈りします。その後、枝刈りされたネットワークから、C/C++ コードまたは CUDA® コードを生成できます。

Deep Learning Toolbox™ Model Compression Library で利用可能な圧縮手法の詳細な概要については、Reduce Memory Footprint of Deep Neural Networksを参照してください。

Simplified illustration of pruning. On the left is a sketch of a neural network with three layers that consist of four, three, and four neurons, respectively. All neurons are connected to all other neurons. An arrow points to a second sketch on the right that shows the same network, but one neuron has been cut out from the middle layer, and two neurons have been cut out from the final layer.

関数

taylorPrunableNetworkNeural network suitable for compression using Taylor pruning (R2022a 以降)
forward学習用の深層学習ネットワーク出力の計算
predict推論用の深層学習ネットワーク出力の計算
updatePrunablesRemove filters from prunable layers based on importance scores (R2022a 以降)
updateScoreCompute and accumulate Taylor-based importance scores for pruning (R2022a 以降)

トピック

注目の例