increaseB

参照データセットの増加

構文

updatedEvaluation = increaseB(evaluation,numsets)

説明

updatedEvaluation = increaseB(evaluation,numsets) は、ギャップ基準クラスタリング評価オブジェクト updatedEvaluation を返します。このオブジェクトは、ギャップ基準クラスタリング評価オブジェクト evaluation と numsets で指定された数の追加の参照データセットを使用します。

例

すべて折りたたむ

追加の参照データを使用したクラスタリングの解の評価

ライブスクリプトを開く

evalclusters を使用して、ギャップクラスタリング評価オブジェクトを作成します。その後、increaseB を使用して、ギャップ基準値の計算に使用する参照データセット数を増やします。

fisheriris データセットを読み込みます。このデータには、3 種のアヤメの花のがく片と花弁からの長さと幅の測定値が含まれています。

load fisheriris

kmeans を使用して花の測定値データをクラスタリングし、ギャップ基準を使用して 1 ～ 5 個のクラスターの推奨される解を評価します。50 個の参照データセットを使用します。

rng("default") % For reproducibility
evaluation = evalclusters(meas,"kmeans","gap","KList",1:5,"B",50)

evaluation = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0870 0.5822 0.8766 1.0007 1.0465]
           OptimalK: 4


  Properties, Methods

クラスタリング評価オブジェクト evaluation には、推奨されるクラスタリングの解のそれぞれに関するデータが格納されています。返された結果から、最適なクラスター数が 4 であることがわかります。

evaluation の B プロパティの値は、50 個の参照データセットを示しています。

evaluation.B

ans = 
50

参照データセットの数を 100 増やして合計 150 個にします。

evaluation = increaseB(evaluation,100)

evaluation = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0794 0.5850 0.8738 1.0034 1.0508]
           OptimalK: 5


  Properties, Methods

今回返された結果からは、最適なクラスター数が 5 であることがわかります。

evaluation の B プロパティの値は、150 個の参照データセットを示しています。

evaluation.B

ans = 
150

入力引数

すべて折りたたむ

`evaluation` — クラスタリング評価データ
`GapEvaluation` オブジェクト

クラスタリング評価データ。GapEvaluation クラスタリング評価オブジェクトとして指定します。クラスタリング評価オブジェクトの作成には evalclusters を使用します。

`numsets` — 追加する参照データセットの数
正の整数スカラー

追加する参照データセットの数。正の整数スカラーとして指定します。

データ型: single | double

出力引数

すべて折りたたむ

`updatedEvaluation` — 更新されたクラスタリング評価データ
`GapEvaluation` オブジェクト

更新されたクラスタリング評価データ。GapEvaluation クラスタリング評価オブジェクトとして返されます。updatedEvaluation には、evaluation オブジェクトの参照データセットと numsets で指定された数の追加の参照データセットを使用して取得された評価データが格納されます。

関数 increaseB は、evaluation オブジェクトの B プロパティを更新し、ギャップ基準値の計算に使用する参照データセット数の増加を反映します。さらに、CriterionValues プロパティを参照データセットの合計数を使用して計算されたギャップ基準値に更新します。参照データセットの合計数を使用して新しい最適なクラスター数と最適なクラスタリングの解が見つかると、increaseB は OptimalK プロパティと OptimalY プロパティを更新します。さらに、LogW、ExpectedLogW、StdLogW、および SE の各プロパティも更新します。

バージョン履歴

R2014a で導入

参考

evalclusters | GapEvaluation

increaseB

構文

説明

例

追加の参照データを使用したクラスタリングの解の評価

入力引数

evaluation — クラスタリング評価データ GapEvaluation オブジェクト

numsets — 追加する参照データ セットの数 正の整数スカラー

出力引数

updatedEvaluation — 更新されたクラスタリング評価データ GapEvaluation オブジェクト

バージョン履歴

参考

`evaluation` — クラスタリング評価データ
`GapEvaluation` オブジェクト

`numsets` — 追加する参照データセットの数
正の整数スカラー

`updatedEvaluation` — 更新されたクラスタリング評価データ
`GapEvaluation` オブジェクト