教師なし学習

データ内の隠れたパターンや、内部構造を発見するための機械学習の手法

教師なし学習は、ラベル付けされた応答がない入力データを使って推論を行うタイプの機械学習のアルゴリズムです。

 最も一般的な教師なし学習の手法は、クラスター分析です。これは、データ内の隠れたパターンやグループ化を発見する探索的データ解析に使用されます。クラスターは、ユークリッド距離や確率的な距離などの指標に基づいて定義される類似度の尺度を使ってモデル化されます。

一般的なクラスタリング アルゴリズムには次のようなものがあります。

  • 階層クラスタリング: クラスターツリーを作成して複数のレベルをもつ階層的なクラスター群を構築します。
  • k 平均法クラスタリング: クラスターの重心までの距離に基づいてデータを k 個の異なるクラスターに分割します。
  • 混合ガウスモデル: 多変量正規密度コンポーネントの混合としてクラスターをモデル化します。
  • 自己組織化マップ: データのトポロジーと分布を学習するニューラルネットワークを使用します。
  • 隠れマルコフモデル: 状態の系列を観測データから復元するために利用します。

教師なし学習は、シーケンス解析や遺伝子クラスタリングといったバイオインフォマティックス分野、系列やパターンのマイニングといったデータマイニングの分野、画像のセグメンテーションといった医療画像処理の分野、物体認識といったコンピュータビジョンの分野で用いられています。

教師なし学習アルゴリズムの詳細については、Statistics and Machine Learning Toolbox™ および Neural Network Toolbox™ をご覧ください。

See also: Statistics and Machine Learning Toolbox, Neural Network Toolbox, machine learning, supervised learning, AdaBoost

Statistics and Machine Learning Toolbox を試してみる

Statistics and Machine Learning Toolbox を試してみる