組み込み AI 向けニューラルネットワークの圧縮:枝刈り、投影、量子化
出典シリーズ: エッジおよび組み込み AI
この Tech Talk では、精度を犠牲にすることなく、組み込みシステム上で効率的に実行できるようにニューラルネットワークモデルを圧縮する方法を解説します。多くのニューラルネットワークは過剰にパラメータ化されており、必要以上の重みや構造を含んでいます。こうした過剰な要素は、枝刈り、射影、量子化という 3 つの強力な手法によって体系的に削減できます。MATLAB® を使った実践的な例を通して、加速度データを用いて路面のひび割れを分類する学習済みモデルを圧縮する方法を学びます。これにより、高い精度を維持しながらモデルサイズを 94 % 以上削減できます。
公開年: 2025 年 8 月 8 日