GapEvaluation
ギャップ基準クラスタリング評価オブジェクト
説明
GapEvaluation は、標本データ (X)、クラスタリング データ (OptimalY) およびギャップ基準値 (CriterionValues) で構成されるオブジェクトであり、最適なクラスター数 (OptimalK) を評価するために使用されます。ギャップ基準値は差分 ExpectedLogW – LogW に対応します。ここで、W はクラスター内の分散で、ExpectedLogW は参照分布からのモンテカルロ サンプリングによって決定され、LogW は標本データから計算されます。最適なクラスター数は、許容誤差の範囲内でローカルまたはグローバルなギャップ値が最大になる解に対応します (SearchMethod)。詳細は、ギャップ値を参照してください。
作成
ギャップ基準クラスタリング評価オブジェクトを作成するには、関数 evalclusters を使用し、基準を "gap" と指定します。
その後、compact を使用して、コンパクトなバージョンのギャップ基準クラスタリング評価オブジェクトを作成できます。この関数は、プロパティ X、OptimalY、および Missing の内容を削除します。
プロパティ
オブジェクト関数
例
詳細
参照
[1] Tibshirani, R., G. Walther, and T. Hastie. “Estimating the number of clusters in a data set via the gap statistic.” Journal of the Royal Statistical Society: Series B. Vol. 63, Part 2, 2001, pp. 411–423.
バージョン履歴
R2013b で導入

