inconsistent

不整合係数

構文

Y = inconsistent(Z)

Y = inconsistent(Z,d)

説明

Y = inconsistent(Z) は、関数 linkage によって生成された階層クラスターツリー Z の各リンクについて不整合係数を返します。inconsistent は、リンクの高さを階層内で同じレベルにある他のリンクの平均の高さと比較することにより、各リンクの不整合係数を計算します。係数が大きくなるほど、リンクで接続されているオブジェクト間の差が大きくなります。詳細は、アルゴリズムを参照してください。

例

Y = inconsistent(Z,d) は、各リンクを深さ d まで探索することにより、ツリー Z における各リンクの不整合係数を返します。

例

すべて折りたたむ

不整合係数の計算

ライブスクリプトを開く

階層クラスターツリーの不整合係数の計算を確認します。

examgrades データセットを読み込みます。

load examgrades

階層クラスターツリーを作成します。

Z = linkage(grades);

inconsistent を使用して、不整合係数情報の行列を作成します。84 番目のリンクについて情報を確認します。

Y = inconsistent(Z);
Y(84,:)

ans = 1×4

    7.2741    0.3624    3.0000    0.5774

Y の 4 列目には、Y の 1 列目に格納されている平均と Y の 2 列目に格納されている標準偏差を使用して計算された不整合係数が含まれています。

Y の行は Z の行に対応するので、Z の 84 番目のリンクを確認します。

Z(84,:)

ans = 1×3

  190.0000  203.0000    7.4833

84 番目のリンクは、ツリー内の 190 番目および 203 番目のクラスターを接続しており、高さは 7.4833 です。190 番目のクラスターは、インデックス $190 - 120 = 70$ のリンクに対応します。120 は観測値の個数です。203 番目のクラスターは 83 番目のリンクに対応します。

既定では、inconsistent は木の 2 つのレベルを使用して Y を計算します。したがって、84 番目のリンクに対する不整合係数の計算には、70 番目、83 番目および 84 番目のリンクのみが使用されます。Z 内のリンクの高さを使用して、Y(84,:) の値を対応する計算と比較します。

mean84 = mean([Z(70,3) Z(83,3) Z(84,3)])

mean84 = 
7.2741

std84 = std([Z(70,3) Z(83,3) Z(84,3)])

std84 = 
0.3624

inconsistent84 = (Z(84,3)-mean84)/std84

inconsistent84 = 
0.5774

不整合係数の計算

ライブスクリプトを開く

標本データを作成します。

X = gallery('uniformdata',[10 2],12);
Y = pdist(X);

階層クラスターツリーを生成します。

Z = linkage(Y,'single');

階層型クラスターツリーのデンドログラムを生成します。

dendrogram(Z)

Figure contains an axes object. The axes object contains 9 objects of type line.

クラスターツリー Z にある各リンクの不整合係数を深さ 3 まで計算します。

W = inconsistent(Z,3)

W = 9×4

    0.1313         0    1.0000         0
    0.1386         0    1.0000         0
    0.1463    0.0109    2.0000    0.7071
    0.2391         0    1.0000         0
    0.1951    0.0568    4.0000    0.9425
    0.2308    0.0543    4.0000    0.9320
    0.2395    0.0748    4.0000    0.7636
    0.2654    0.0945    4.0000    0.9203
    0.3769    0.0950    3.0000    1.1040

入力引数

すべて折りたたむ

`Z` — 凝集型の階層クラスターツリー
数値行列

凝集型の階層クラスターツリー。linkage によって返される数値行列を指定します。Z は (m – 1) 行 3 列の行列です。m は観測値の個数です。Z の列 1 および 2 には、二分木を形成するためにペアでリンクされているクラスターインデックスを格納します。Z(I,3) には、行 Z(I,:) でマージされた 2 つのクラスターの間のリンク距離を格納します。

データ型: single | double

`d` — 深さ
`2` (既定値) | 正の整数スカラー

深さ。正の整数スカラーを指定します。inconsistent は、各リンク k について、k より下の d レベル以内にあるツリーに含まれているすべてのリンクを使用して、対応する不整合係数を計算します。

データ型: single | double

出力引数

すべて折りたたむ

`Y` — 不整合係数情報
数値行列

不整合係数情報。(m – 1) 行 4 列の行列として返されます。(m – 1) 個の行は Z の行に対応します。次の表で Y の列について説明します。

列	説明
1	計算に含まれるすべてのリンクの高さの平均
2	計算に含まれるすべてのリンクの高さの標準偏差
3	計算に含まれるリンクの数
4	不整合係数

データ型: double

アルゴリズム

各リンク k について、不整合係数は次のように計算されます。

$Y (k, 4) = (Z (k, 3) - Y (k, 1)) / Y (k, 2),$

Y は、階層クラスターツリー Z 内のリンクについての不整合係数情報です。

下位にリンクがないリンクについては、不整合係数が 0 に設定されます。

参照

[1] Jain, A., and R. Dubes. Algorithms for Clustering Data. Upper Saddle River, NJ: Prentice-Hall, 1988.

[2] Zahn, C. T. “Graph-theoretical methods for detecting and describing Gestalt clusters.” IEEE Transactions on Computers. Vol. C-20, Issue 1, 1971, pp. 68–86.

バージョン履歴

R2006a より前に導入

参考

トピック

階層クラスタリング

inconsistent

構文

説明

例

不整合係数の計算

不整合係数の計算

入力引数

Z — 凝集型の階層クラスター ツリー 数値行列

d — 深さ 2 (既定値) | 正の整数スカラー

出力引数

Y — 不整合係数情報 数値行列

アルゴリズム

参照

バージョン履歴

参考

トピック

`Z` — 凝集型の階層クラスターツリー
数値行列

`d` — 深さ
`2` (既定値) | 正の整数スカラー

`Y` — 不整合係数情報
数値行列