ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

cophenet

コーフェン相関係数

構文

c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)

説明

c = cophenet(Z,Y) は、Z が表す階層クラスター ツリーのコーフェン相関係数を計算します。Z は、関数 linkage の出力です。Y には、関数 pdist によって出力される Z の作成に使用された距離または非類似度が含まれています。Z は、3 番目の列に距離情報のあるサイズが (m–1) 行 3 列の行列です。Y は、サイズが m*(m–1)/2 のベクトルです。

[c,d] = cophenet(Z,Y) は、コーフェン距離 dY と同じ下位三角距離ベクトル形式で返します。

クラスター ツリーのコーフェン相関は、ツリーから得たコーフェン距離と、そのツリーを作成するときに使用された元の距離 (非類似度) との間の線形相関係数で定義されます。これは、ツリーが観測間の非類似度をどれだけ忠実に表しているかの尺度になります。

2 つの観測間のコーフェン距離は、系統樹では 2 つの観測が最初に結合されたときのリンクの高さで表されます。高さがそのリンクで結合された 2 つのサブクラスター間の距離です。

出力値 c がコーフェン相関係数です。この値は解の精度が高いほど 1 に近づきます。この尺度は、さまざまなアルゴリズムを使用して得たクラスターの解を比較するときに使用できます。

Z(:,3)Y の間のコーフェン相関係数は次のように定義されます。

c=i<j(Yijy)(Zijz)i<j(Yijy)2i<j(Zijz)2

ここで、

  • Yij は、Y に含まれているオブジェクト i とオブジェクト j の距離です。

  • Zij は、Z(:,3) から得られるオブジェクト i とオブジェクト j のコーフェン距離です。

  • y と z はそれぞれ YZ(:,3) の平均です。

X = [rand(10,3); rand(10,3)+1; rand(10,3)+2];
Y = pdist(X);
Z = linkage(Y,'average');

% Compute Spearman's rank correlation between the
% dissimilarities and the cophenetic distances
[c,D] = cophenet(Z,Y);
r = corr(Y',D','type','spearman')
r =
   0.8279 

R2006a より前に導入