特徴抽出とは
特徴抽出とは、生データを数値的な特徴量に変換するプロセスのことで、元のデータセットの情報を保持したまま処理できるようにします。それにより、生データにそのまま機械学習を適用するよりも良い結果が得られます。
特徴抽出は手動または自動で実行できます。
- 手動による特徴抽出は、ある問題に関連する特徴を特定して記述し、それらを抽出する方法を実装する必要があります。多くの場合、背景や分野に関する十分な知識があると、情報に基づいてどの特徴が役立つかを判断することができます。数十年にもわたる研究の中で、エンジニアや科学者は画像、信号、テキストから特徴量を抽出する手法を開発してきました。単純な特徴量の例として、信号内のウィンドウ区間の平均値が挙げられます。
- 自動特徴抽出は、特殊なアルゴリズムやディープネットワークを用いて、信号や画像から人手を介さずに自動的に特徴量を抽出します。この手法は、生データから素早く機械学習アルゴリズムの開発に進みたい場合に非常に役立ちます。ウェーブレット散乱は、自動特徴抽出の一例です。
ディープラーニングの台頭により、特徴抽出の多くはディープネットワークの初期層で処理されるようになってきましたが、この傾向は主に画像データに関するものです。信号や時系列データの分野では、依然として特徴抽出が最初の難関であり、効果的な予測モデルの構築を実現するまでに高度な専門知識が求められます。
信号と時系列データの特徴抽出
特徴抽出は、信号内の最も識別性の高い特性を見つけ出すことで、機械学習やディープラーニングのアルゴリズムが容易に処理できるようにします。生の信号データをそのまま使用して機械学習やディープラーニングを学習させても、データレートの高さと情報の冗長性により、十分な結果が得られないことがよくあります。
信号と時系列データに特徴抽出を適用し、機械学習分類器に入力するまでの概略図。
信号の特徴と時間-周波数変換
信号とセンサーデータを解析する場合、Signal Processing Toolbox™ と Wavelet Toolbox™ に、時間、周波数、時間-周波数の各ドメインで信号の代表的な特徴量を測定できる関数が用意されています。パルスや遷移指標の適用、S/N 比 (SNR) の測定、スペクトル エントロピーや尖度の推定、パワースペクトルの計算を行うことができます。
短時間フーリエ変換 (STFT) などの時間-周波数変換は、機械学習やディープラーニング モデルの学習用データの信号表現として利用できます。たとえば、畳み込みニューラルネットワーク (CNN) は画像データに対して一般的に用いられており、時間-周波数変換によって得られる 2 次元の信号表現から効果的に学習することができます。
短時間フーリエ変換を使用した信号のスペクトログラム。スペクトログラムは、経時的な周波数成分の変化を示しています。
特定の用途や特性に応じて、他の時間-周波数変換も利用できます。たとえば、定 Q 変換 (CQT) は対数間隔の周波数分布を提供します。連続ウェーブレット変換 (CWT) は通常、非定常信号内の短い過渡現象を識別するのに効果的です。
オーディオ用途と予知保全のための特徴量
Audio Toolbox™ は、メルスペクトログラム、オクターブ フィルター バンク、ガンマトーン フィルター バンク、離散コサイン変換 (DCT) など、オーディオ、音声、音響によく利用される時間-周波数変換を提供します。これらの信号に利用される特徴抽出手法には、他にもメル周波数ケプストラム係数 (MFCC)、ガンマトーン ケプストラム係数 (GTCC)、ピッチ、調和性、さまざまな種類のオーディオスペクトル記述子などがあります。オーディオ特徴抽出器ツールは、中間計算を再利用しながら効率的に、同じソース信号から異なるオーディオ特徴量を選択して抽出することができます。
エンジニアが状態監視や予知保全向けにアプリケーションを開発する際は、Predictive Maintenance Toolbox™ の診断特徴デザイナーアプリで特徴量の抽出、可視化、ランク付けを行い、機械の健全性を監視するために用いる状態インジケーターを設計することができます。
診断特徴デザイナーアプリを使用すると、正常なシステムと故障したシステムを識別する特徴量を設計し、比較することができます。
自動特徴抽出手法
自動特徴抽出は、最適化されたモデルを提供する完全な AutoML ワークフローの一部です。このワークフローは、特徴量選択、モデル選択、およびハイパーパラメーター調整を自動化する 3 つのシンプルなステップから構成されています。
信号から特徴量を自動的に抽出する新しい高度な手法が登場しています。オートエンコーダー、ウェーブレット散乱、ディープ ニューラル ネットワークは、特徴量の抽出やデータの次元削減によく用いられます。
ウェーブレット散乱ネットワークは、実数値の時系列や画像データから分散の少ない特徴量を自動的に抽出します。この手法では、クラス間の識別性を維持しながら、クラス内の差異を最小限に抑えるデータ表現が生成されます。ウェーブレット散乱は、元となるデータが少ない場合に効果的です。
画像データの特徴抽出
画像データの特徴抽出では、画像の注目すべき部分をコンパクトな特徴ベクトルとして表現します。かつては、これを実現するために、特徴の検出、抽出、マッチングのそれぞれに専用のアルゴリズムが用いられていました。現在では、ディープラーニングが画像や映像の解析に広く用いられています。この手法は、特徴抽出の工程を省略して生の画像データをそのまま入力として扱えることで知られています。採用する手法に関係なく、画像レジストレーション、オブジェクトの検出と分類、コンテンツベースの画像検索といったコンピューター ビジョン アプリケーションでは、常に画像特徴の効果的な表現が必要になります。その際に、ディープラーニングの初期層で暗黙的に特徴抽出を行う場合もあれば、従来の手法を使って明示的に行う場合もあります。
特徴検出、特徴抽出、およびマッチングを組み合わせて使用した、雑然としたシーン (右) でのオブジェクト検出 (左)。詳細については例を参照してください。
Computer Vision Toolbox™ と Image Processing Toolbox™ では、以下の特徴抽出手法が提供されています。
- 勾配方向ヒストグラム (HOG)
- Speeded-Up Robust Features (SURF)
- ローカル バイナリ パターン (LBP) 特徴量
- Scale Invariant Feature Transform (SIFT)
画像の勾配方向ヒストグラム (HOG) 特徴抽出 (上)。画像を表現するためにセルの大きさを変化させて生成された異なるサイズの特徴ベクトル (下)。詳細については例を参照してください。
製品使用例および使い方
ソフトウェア リファレンス
参考: 特徴のマッチング, オブジェクト検出, 手振れ補正, 画像処理およびコンピューター ビジョン, 画像認識, オブジェクト検出, オブジェクト認識, デジタル画像処理, オプティカルフロー, RANSAC, パターン認識, 点群, ディープラーニング, 特徴選択, コンピューター ビジョン, AutoML