Main Content

kstest2

2 標本コルモゴロフ・スミルノフ検定

説明

h = kstest2(x1,x2) は、2 標本コルモゴロフ・スミルノフ検定を使用して、ベクトル x1x2 のデータが同じ連続分布から派生しているという帰無仮説の検定の判定を返します。対立仮説は、x1x2 が異なる連続分布から派生するとします。検定で帰無仮説が有意水準 5% で棄却された場合、結果 h1、それ以外の場合は 0 になります。

h = kstest2(x1,x2,Name,Value) は、1 つ以上の名前と値のペア引数で指定された追加のオプションを使用した 2 標本コルモゴロフ・スミルノフ検定の検定の判定を返します。たとえば、有意水準を変更したり、片側検定を実行することができます。

[h,p] = kstest2(___) は、前の構文の入力引数のいずれかを使用して、漸近的な p 値 p も返します。

[h,p,ks2stat] = kstest2(___) は、検定統計量 ks2stat も返します。

すべて折りたたむ

2 つの異なるワイブル分布から標本データを生成します。

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

ベクトル x1 および x2 のデータは同じ分布をもつ母集団から派生するという帰無仮説を検定します。

h = kstest2(x1,x2)
h = logical
   1

h = 1 の戻り値は、kstest が既定の有意水準 5% で帰無仮説を棄却することを示します。

2 つの異なるワイブル分布から標本データを生成します。

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

データ ベクトル x1 および x2 は、有意水準 1% で同じ分布をもつ母集団から派生するという帰無仮説を検定します。

[h,p] = kstest2(x1,x2,'Alpha',0.01)
h = logical
   0

p = 0.0317

h = 0 の戻り値は、kstest が有意水準 1% で帰無仮説を棄却しないことを示します。

2 つの異なるワイブル分布から標本データを生成します。

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

ベクトル x1 および x2 のデータが同じ分布をもつ母集団から派生しているという帰無仮説を、x1 の分布の累積分布関数は x2 の分布の累積分布関数よりも大きいという対立仮説に対して検定します。

[h,p,k] = kstest2(x1,x2,'Tail','larger')
h = logical
   1

p = 0.0158
k = 0.2800

h = 1 の戻り値は、x1 の分布の累積分布関数は x2 の分布の累積分布関数よりも大きいという対立仮説を優先し、既定の有意水準 5% で kstest が帰無仮説を棄却することを示します。k の戻り値は、2 標本コルモゴロフ・スミルノフ検定の検定統計量です。

入力引数

すべて折りたたむ

最初の標本の標本データ。ベクトルとして指定します。データ ベクトル x1 および x2 を同じサイズにする必要はありません。

データ型: single | double

2 番目の標本の標本データ。ベクトルとして指定します。データ ベクトル x1 および x2 を同じサイズにする必要はありません。

データ型: single | double

名前と値の引数

オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで Name は引数名、Value は対応する値です。名前と値の引数は他の引数の後ろにする必要がありますが、ペアの順序は関係ありません。

R2021a より前では、名前と値をそれぞれコンマを使って区切り、Name を引用符で囲みます。

例: 'Tail','larger','Alpha',0.01 は、x1 の経験的累積分布関数が x2 の経験的累積分布関数より大きいという対立仮説を使用する検定を 1% の有意水準で実施するよう指定します。

仮説検定の有意水準。'Alpha' と、(0,1) の範囲内のスカラー値で構成されるコンマ区切りのペアとして指定します。

例: 'Alpha',0.01

データ型: single | double

評価する対立仮説のタイプ。'Tail' と以下のいずれかで構成される、コンマ区切りのペアとして指定します。

'unequal'x1 の経験的累積分布関数は x2 の経験的累積分布関数と等しくないという対立仮説を検定します。
'larger'x1 の経験的累積分布関数は x2 の経験的累積分布関数よりも大きいという対立仮説を検定します。
'smaller'x1 の経験的累積分布関数は x2 の経験的累積分布関数よりも小さいという対立仮説を検定します。

x1 のデータ値が x2 のデータ値よりも大きくなる傾向にある場合、x1 の経験的分布関数は、x2 の経験的分布関数より小さくなる傾向にあり、その逆も同じです。

例: 'Tail','larger'

出力引数

すべて折りたたむ

論理値として返される仮説検定の結果。

  • h = 1 の場合、有意水準 Alpha で帰無仮説が棄却されることを示します。

  • h = 0 の場合、有意水準 Alpha で帰無仮説が棄却できなかったことを示します。

(0,1) の範囲のスカラー値として返される、検定の漸近的な p 値。p は、帰無仮説に基づく観測値と同様に、極端な検定統計量、またはより極端な検定統計量が観測される確率です。漸近 p 値は、標本サイズが大きいと精度が高くなり、標本サイズ n1n2(n1*n2)/(n1 + n2)4 のような場合、比較的正確であると考えられています。

検定統計量。非負のスカラー値として返されます。

詳細

すべて折りたたむ

2 標本コルモゴロフ・スミルノフ検定

2 標本コルモゴロフ・スミノルフ検定は、各データ セットの x の範囲における 2 つの標本データのベクトルの分布の累積分布関数間の差を評価するノンパラメトリック仮説検定です。

両側検定では、2 つのデータ ベクトルの分布の累積分布関数間の差の最大絶対値を使用します。検定統計量は以下のとおりです。

D*=maxx(|F^1(x)F^2(x)|),

ここで、F^1(x) は x 以下の x1 の値の比率、F^2(x) は x 以下の x2 の値の比率です。

片側検定では、2 つのデータ ベクトルの分布の累積分布関数間の差の絶対値ではなく、実際の値を使用します。検定統計量は次のようになります。

D*=maxx(F^1(x)F^2(x)).

アルゴリズム

kstest2 では、帰無仮説を棄却するかどうかは、検定統計量 ks2stat を棄却限界値と比較するのではなく、p 値 p を有意水準 Alpha と比較して決定します。

参照

[1] Massey, F. J. “The Kolmogorov-Smirnov Test for Goodness of Fit.” Journal of the American Statistical Association. Vol. 46, No. 253, 1951, pp. 68–78.

[2] Miller, L. H. “Table of Percentage Points of Kolmogorov Statistics.” Journal of the American Statistical Association. Vol. 51, No. 273, 1956, pp. 111–121.

[3] Marsaglia, G., W. Tsang, and J. Wang. “Evaluating Kolmogorov’s Distribution.” Journal of Statistical Software. Vol. 8, Issue 18, 2003.

バージョン履歴

R2006a より前に導入