ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

increaseB

クラス: clustering.evaluation.GapEvaluation
パッケージ: clustering.evaluation

参照データセットの増加

構文

eva_out = increaseB(eva,nref)

説明

eva_out = increaseB(eva,nref) は、ギャップ基準クラスタリング評価オブジェクト eva_out を返します。このオブジェクトは入力オブジェクト eva と同じ評価基準と、nref で指定された数の追加の参照データセットを使用します。

入力引数

すべて展開する

クラスタリング評価データ。クラスタリング評価オブジェクトとして指定します。evalclusters を使用して、クラスタリング評価オブジェクトを作成します。

追加する参照データセットの数。正の整数値として指定します。

出力引数

すべて展開する

更新されたクラスタリング評価データ。ギャップ基準クラスタリング評価オブジェクトとして返します。eva_out には、参照データセットを使って入力オブジェクト eva から取得した評価データと nref で指定された数の追加の参照データセットを使用して取得された評価データが格納されています。

increaseB は、ギャップ基準値の計算に使用する参照データセット数の増加を反映するために、入力オブジェクト evaB プロパティを更新します。increaseB は、参照データセットの総数を使用して計算されたギャップ基準値をもつ CriterionValues も更新します。また、increaseB は参照データセットの総数を使用して特定されたクラスターの最適数とクラスタリングの最適解を反映するために、OptimalK および OptimalY プロパティも更新することがあります。さらに、increaseBLogWExpectedLogWStdLogWSE の各プロパティを更新する場合もあります。

すべて展開する

evalclusters を使用してギャップ クラスタリング評価オブジェクトを作成してから、increaseB を使用して、ギャップ基準値の計算に使用する参照データセット数を増加させます。

標本データを読み込みます。

load fisheriris

このデータには、3 種のアヤメの花のがく片と花弁からの長さと幅の測定値が含まれています。

kmeans を使用して花の測定値データをクラスタリングし、ギャップ基準を使用して 1 ~ 5 個のクラスターの推奨される解を評価します。50 個の参照データセットを使用します。

rng('default') % For reproducibility
eva = evalclusters(meas,'kmeans','gap','klist',1:5,'B',50)
eva = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0870 0.5822 0.8766 1.0007 1.0465]
           OptimalK: 4

クラスタリング評価オブジェクト eva には、推奨されるクラスタリングの解のそれぞれに関するデータが格納されています。返された結果から、最適なクラスター数が 4 であることがわかります。

evaB プロパティの値は、50 個の参照データセットを示しています。

eva.B
ans = 50

参照データセットの数を 100 増やして合計 150 個にします。

eva = increaseB(eva,100)
eva = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0794 0.5850 0.8738 1.0034 1.0508]
           OptimalK: 5

今回返された結果からは、最適なクラスター数が 5 であることがわかります。

evaB プロパティの値は、150 個の参照データセットを示しています。

eva.B
ans = 150