ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

inconsistent

説明

Y = inconsistent(Z) は、関数 linkage によって生成された階層クラスター ツリー Z の各リンクについて不整合係数を返します。inconsistent は、リンクの高さを階層内で同じレベルにある他のリンクの平均の高さと比較することにより、各リンクの不整合係数を計算します。係数が大きくなるほど、リンクで接続されているオブジェクト間の差が大きくなります。詳細は、アルゴリズムを参照してください。

Y = inconsistent(Z,d) は、各リンクを深さ d まで探索することにより、ツリー Z における各リンクの不整合係数を返します。

すべて折りたたむ

階層クラスター ツリーの不整合係数の計算を確認します。

examgrades データセットを読み込みます。

load examgrades

階層クラスター ツリーを作成します。

Z = linkage(grades);

inconsistent を使用して、不整合係数情報の行列を作成します。84 番目のリンクについて情報を確認します。

Y = inconsistent(Z);
Y(84,:)
ans = 1×4

    7.2741    0.3624    3.0000    0.5774

Y の 4 列目には、Y の 1 列目に格納されている平均と Y の 2 列目に格納されている標準偏差を使用して計算された不整合係数が含まれています。

Y の行は Z の行に対応するので、Z の 84 番目のリンクを確認します。

Z(84,:)
ans = 1×3

  190.0000  203.0000    7.4833

84 番目のリンクは、ツリー内の 190 番目および 203 番目のクラスターを接続しており、高さは 7.4833 です。190 番目のクラスターは、インデックス 190-120=70 のリンクに対応します。120 は観測値の個数です。203 番目のクラスターは 83 番目のリンクに対応します。

既定では、inconsistent は木の 2 つのレベルを使用して Y を計算します。したがって、84 番目のリンクに対する不整合係数の計算には、70 番目、83 番目および 84 番目のリンクのみが使用されます。Z 内のリンクの高さを使用して、Y(84,:) の値を対応する計算と比較します。

mean84 = mean([Z(70,3) Z(83,3) Z(84,3)])
mean84 = 7.2741
std84 = std([Z(70,3) Z(83,3) Z(84,3)])
std84 = 0.3624
inconsistent84 = (Z(84,3)-mean84)/std84
inconsistent84 = 0.5774

標本データを作成します。

X = gallery('uniformdata',[10 2],12);
Y = pdist(X);

階層クラスター ツリーを生成します。

Z = linkage(Y,'single');

階層型クラスター ツリーの系統樹を生成します。

dendrogram(Z)

クラスター ツリー Z にある各リンクの不整合係数を深さ 3 まで計算します。

W = inconsistent(Z,3)
W = 9×4

    0.1313         0    1.0000         0
    0.1386         0    1.0000         0
    0.1463    0.0109    2.0000    0.7071
    0.2391         0    1.0000         0
    0.1951    0.0568    4.0000    0.9425
    0.2308    0.0543    4.0000    0.9320
    0.2395    0.0748    4.0000    0.7636
    0.2654    0.0945    4.0000    0.9203
    0.3769    0.0950    3.0000    1.1040

入力引数

すべて折りたたむ

凝集型の階層クラスター ツリー。linkage によって返される数値行列を指定します。Z(m - 1) 行 3 列の行列です。m は観測値の個数です。Z の列 1 および 2 には、二分木を形成するためにペアでリンクされているクラスター インデックスを格納します。Z(I,3) には、行 Z(I,:) でマージされた 2 つのクラスターの間のリンク距離を格納します。

データ型: single | double

深さ。正の整数スカラーを指定します。inconsistent は、各リンク k について、k より下の d レベル以内にあるツリーに含まれているすべてのリンクを使用して、対応する不整合係数を計算します。

データ型: single | double

出力引数

すべて折りたたむ

不整合係数情報。(m - 1) 行 4 列の行列として返されます。(m - 1) 個の行は Z の行に対応します。次の表で Y の列について説明します。

説明

1

計算に含まれるすべてのリンクの高さの平均

2

計算に含まれるすべてのリンクの高さの標準偏差

3

計算に含まれるリンクの数

4

不整合係数

データ型: double

アルゴリズム

各リンク k について、不整合係数は次のように計算されます。

Y(k,4)=(Z(k,3)Y(k,1))/Y(k,2),

Y は、階層クラスター ツリー Z 内のリンクについての不整合係数情報です。

下位にリンクがないリンクについては、不整合係数が 0 に設定されます。

参照

[1] Jain, A., and R. Dubes. Algorithms for Clustering Data. Upper Saddle River, NJ: Prentice-Hall, 1988.

[2] Zahn, C. T. “Graph-theoretical methods for detecting and describing Gestalt clusters.” IEEE Transactions on Computers. Vol. C-20, Issue 1, 1971, pp. 68–86.

R2006a より前に導入