Main Content

addK

追加クラスター数の評価

    説明

    updatedEvaluation = addK(evaluation,klist) はクラスタリング評価オブジェクト updatedEvaluation を返します。このオブジェクトには、クラスタリング評価オブジェクト evaluation 内の評価データと、klist で指定された推奨されるクラスター数に対する追加評価データが格納されています。

    すべて折りたたむ

    evalclusters を使用してクラスタリング評価オブジェクトを作成し、その後 addK を使用して追加クラスター数を評価します。

    fisheriris データ セットを読み込みます。このデータには、3 種のアヤメの花のがく片と花弁からの長さと幅の測定値が含まれています。

    load fisheriris

    kmeans を使用して花の測定値データをクラスタリングし、Calinski-Harabasz 基準を使用して 1 ~ 5 個のクラスターの推奨される解を評価します。

    evaluation = evalclusters(meas,"kmeans","CalinskiHarabasz","KList",1:5)
    evaluation = 
      CalinskiHarabaszEvaluation with properties:
    
        NumObservations: 150
             InspectedK: [1 2 3 4 5]
        CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279]
               OptimalK: 3
    
    
    

    クラスタリング評価オブジェクト evaluation には、推奨されるクラスタリングの解のそれぞれに関するデータが格納されています。OptimalK の戻り値は、3 個のクラスターが最適解であることを示しています。

    同じ基準を使用して、6 ~ 10 個のクラスターの推奨される解を評価します。これらの評価を元のクラスタリング評価オブジェクトに追加します。

    evaluation = addK(evaluation,6:10)
    evaluation = 
      CalinskiHarabaszEvaluation with properties:
    
        NumObservations: 150
             InspectedK: [1 2 3 4 5 6 7 8 9 10]
        CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279 469.5068 449.6410 435.8182 413.3837 386.5571]
               OptimalK: 3
    
    
    

    更新された InspectedKCriterionValues の値から、evaluation が 1 ~ 10 個のクラスターの推奨される解を評価していることがわかります。OptimalK の値は 3 のままで、3 個のクラスターが最適解のままであることを示しています。

    入力引数

    すべて折りたたむ

    クラスタリング評価データ。CalinskiHarabaszEvaluationDaviesBouldinEvaluationGapEvaluationSilhouetteEvaluation のいずれかのクラスタリング評価オブジェクトとして指定します。クラスタリング評価オブジェクトの作成には evalclusters を使用します。

    評価する追加クラスター数。正の整数ベクトルとして指定します。klist のいずれかの値が、evaluation オブジェクトで既に評価されているクラスタリングの解と重複する場合、addK はこの重複値を無視します。

    データ型: single | double

    出力引数

    すべて折りたたむ

    更新されたクラスタリング評価データ。CalinskiHarabaszEvaluationDaviesBouldinEvaluationGapEvaluationSilhouetteEvaluation のいずれかのクラスタリング評価オブジェクトとして返されます。updatedEvaluation には、evaluation に保存された推奨クラスタリング解についてのデータと、klist に指定された追加の推奨クラスター数に関するデータが保存されています。

    すべてのクラスタリング評価オブジェクトでは、addK によって InspectedK および CriterionValues プロパティが更新され、klist に指定された推奨クラスタリング解およびそれに対応する条件値が保存されています。新しい最適なクラスター数と最適なクラスタリングの解が見つかると、addKOptimalK プロパティと OptimalY プロパティも更新します。

    特定のクラスタリング評価オブジェクトについて、addK は次の追加プロパティ値を更新します。

    • LogWExpectedLogWStdLogWSE (ギャップ基準評価オブジェクトの場合)

    • ClusterSilhouettes (シルエット基準評価オブジェクトの場合)

    バージョン履歴

    R2014a で導入