このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。
クラスター分析
データの自然なグループとパターンを見つけるための教師なし学習法
"クラスター分析" はセグメント分析または分類分析とも呼ばれ、標本データをグループ、つまり "クラスター" に分割します。クラスターは、同じクラスター内のオブジェクトは似ており、異なるクラスターのオブジェクトは異なるように形成されます。Statistics and Machine Learning Toolbox™ には、いくつかのクラスタリング手法と、クラスターを作成するための類似度の尺度 ("距離計量" とも呼ばれます) が用意されています。さらに、"クラスター評価" では、各種の評価基準を使用してデータに最適なクラスター数を決定します。"クラスター可視化" オプションには、系統樹とシルエット プロットがあります。ツールボックスには、外れ値および新規性を特定するためのいくつかの "異常検出" 機能も用意されています。
クラスター分析の基礎
カテゴリ
- 階層クラスタリング
クラスターの入れ子セットの生成
- k-means および kMedoid クラスタリング
平均距離または medoid 距離の最小化によるクラスター、およびマハラノビス距離の計算
- DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
DBSCAN アルゴリズムを使用してクラスターと外れ値を求める
- スペクトル クラスタリング
グラフベースのアルゴリズムを使用してクラスターを求める
- 混合ガウス モデル
期待値最大化アルゴリズムを使用した混合ガウス モデルに基づくクラスター
- 最近傍
網羅的探索または Kd 木探索を使用して最近傍を探索
- 隠れマルコフ モデル
データ生成用のマルコフ モデル
- 異常検出
外れ値および新規性の検出
- クラスターの可視化と評価
データのクラスターをプロットおよびクラスターの最適数を評価