クラスター分析と異常検出

データの自然なグループ、パターン、異常を見つけるための教師なし学習法

"クラスター分析" はセグメント分析または分類分析とも呼ばれ、標本データをグループ、つまり "クラスター" に分割します。クラスターは、同じクラスター内のオブジェクトは似ており、異なるクラスターのオブジェクトは異なるように形成されます。Statistics and Machine Learning Toolbox™ には、いくつかのクラスタリング手法と、クラスターを作成するための類似度の尺度 ("距離計量" とも呼ばれます) が用意されています。さらに、"クラスター評価" では、各種の評価基準を使用してデータに最適なクラスター数を決定します。"クラスター可視化" オプションには、デンドログラムとシルエットプロットがあります。

"異常検出" は、標本データの想定されるパターンまたは分布から逸脱した観測値を識別する機械学習の一分野です。Statistics and Machine Learning Toolbox には、外れ値および新規性の検出のためのいくつかの手法 (教師なし異常検出を参照) とストリーミングデータの異常を検出するための追加の方法 (Incremental Anomaly Detection Overviewを参照) が用意されています。

クラスター分析の基礎

クラスター分析手法の選択

Click to go to the example, Cluster Gaussian Mixture Data Using Hard Clustering

注目の例