ranksum

ウィルコクソン順位和検定

構文

p = ranksum(x,y)

[p,h] = ranksum(x,y)

[p,h,stats] = ranksum(x,y)

[___] = ranksum(x,y,Name,Value)

説明

p = ranksum(x,y) は、ウィルコクソン順位和検定の両側値 p を返します。ranksum は、x および y のデータが、等しい中央値をもつ連続分布からの標本であるという帰無仮説を、その対立仮説に対して検定します。この検定では 2 つの標本が独立していると仮定します。x と y の長さは異なる場合があります。

この検定は、マン・ホイットニー U 検定と同等です。

例

[p,h] = ranksum(x,y) は、検定の判定を示す論理値も返します。h = 1 の結果は帰無仮説が棄却されることを示し、h = 0 の場合は有意水準 5% で帰無仮説を棄却できないことを示します。

例

[p,h,stats] = ranksum(x,y) は検定統計量に関する情報を含む stats 構造体も返します。

例

[___] = ranksum(x,y,Name,Value) は、1 つ以上の Name,Value のペア引数により指定される追加のオプションを使用した順位和検定について、前の構文の任意の出力引数を返します。

例

すべて折りたたむ

2 つの母集団の中央値の等価性に関する検定

ライブスクリプトを開く

サイズが同じではない 2 つの別々の標本の中央値が等しいという仮説を検証します。

標本データを生成します。

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

これらの標本は、0.25 の位置シフトを除き、等しい分布をもつ母集団から派生しています。

x と y の中央値の等価性を検定します。

p = ranksum(x,y)

p = 
0.0375

$p$ 値 0.0375 は、既定の有意水準 5% で中央値が等しいという帰無仮説を ranksum が棄却することを示します。

2 つの母集団の中央値の検定統計量

ライブスクリプトを開く

2 つの母集団の中央値の等価性に対応する検定の統計値を取得します。

標本データを読み込みます。

load mileage

最初の車種と 2 番目の車種で、ガロンあたりのマイル数による燃費が同じかどうかを検定します。

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))

p = 
0.0043

h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

$p$ 値 0.043 と h = 1 の両方が、既定の有意水準 5% で中央値が等しいという帰無仮説が棄却されることを示します。標本サイズが小さいため (それぞれ 6 行)、ranksum は厳密法を使用して $p$ 値を計算します。stats 構造体には、順位和検定統計量の値のみが含まれます。

中央値の増加

ライブスクリプトを開く

母集団の中央値が増加するという仮説を検定します。

標本データを読み込みます。

load('weather.mat');

この気象データは 2 年連続で同じ月に観測された毎日の最高気温を示します。

左側検定を実行して 1% の有意水準で中央値が増加したかどうかを検証します。

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')

p = 
0.1271

h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

$p$ 値 0.1271 と logical 値 h = 0 から、帰無仮説を棄却する十分な証拠はありません。つまり、この結果は 1 年目と 2 年目のその月の最高気温の中央値において有意水準 1% で正のシフトがあることは示していません。標本が大規模なため ranksum が近似法を使用して $p$ 値を計算する点に注意してください。

厳密法を使用して $p$ 値を計算します。

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')

p = 
0.1273

h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

近似メソッドと厳密なメソッドの結果は一致しています。

入力引数

すべて折りたたむ

`x` — 標本データ
ベクトル

ベクトルとして指定される標本データ。

データ型: single | double

`y` — 標本データ
ベクトル

ベクトルとして指定される標本データ。y の長さは x の長さと同じでなくても構いません。

データ型: single | double

名前と値の引数

すべて折りたたむ

オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで、Name は引数名で、Value は対応する値です。名前と値の引数は他の引数の後に指定しなければなりませんが、ペアの順序は重要ではありません。

R2021a より前では、名前と値をそれぞれコンマを使って区切り、Name を引用符で囲みます。

例: 'alpha',0.01,'method','approximate','tail','right' は有意水準 1% で右側順位和検定を指定し、p の近似値を返します。

`alpha` — 有意水準
0.05 (既定値) | 0 ～ 1 の範囲のスカラー値

仮説検定を判断するための有意水準。'alpha' と 0 ～ 1 の範囲のスカラー値で構成されるコンマ区切りのペアとして指定します。h の有意水準は 100 * alpha% です。

例: 'alpha', 0.01

データ型: double | single

`method` — p 値の計算方法
`'exact'` | `'approximate'`

p 値 p の計算方法。'method' と以下のいずれかで構成される、コンマ区切りペアとして指定します。

`'exact'`	p 値 `p` の正確な計算。
`'approximate'`	p 値 `p` の計算時の正規近似。

'method' を指定しない場合、次の既定の設定が使用されます。

min(n_x,n_y) < 10 および n_x + n_y < 20 の場合は 'exact'
それ以外の場合は 'approximate'

ここで、n_x と n_y は、それぞれ x と y の標本サイズです。

例: 'method','exact'

`tail` — 検定のタイプ
`'both'` (既定値) | `'right'` | `'left'`

検定のタイプ。'tail' と以下のいずれかで構成される、コンマ区切りペアとして指定します。

`'both'`	両側仮説検定。対立仮説は `x` と `y` の中央値が異なることを示します。`'tail'` を指定しない場合は既定の検定タイプとして使用されます。
`'right'`	右側仮説検定。対立仮説は `x` の中央値が `y` の中央値より大きいことを示します。
`'left'`	左側仮説検定。対立仮説は `x` の中央値が `y` の中央値より小さいことを主張します。

例: 'tail','left'

出力引数

すべて折りたたむ

`p` — 検定の p 値
非負のスカラー

0 ～ 1 の正のスカラーとして返される、検定の p 値。p は、帰無仮説に基づく観測値よりさらに極端な検定統計量が観測される確率です。ranksum は、最も有意な片側値を 2 倍にして両側 p 値を計算します。

`h` — 仮説検定の結果
1 | 0

仮説検定の結果。論理値として返します。

h = 1 の場合、有意水準 100 * alpha% で帰無仮説が棄却されることを示します。
h = 0 の場合、有意水準 100 * alpha% で帰無仮説を棄却できないことを示します。

`stats` — 検定統計量
構造体

構造体として返される検定統計量。stats に格納される検定統計量は次のとおりです。

ranksum :順位和検定統計量の値
zval:('method' が 'approximate' の場合に計算される) z 統計量の値

詳細

すべて折りたたむ

ウィルコクソン順位和検定

ウィルコクソン順位和検定は、標本が独立している場合に 2 つの母集団に対して行うノンパラメトリック検定です。X と Y がサイズの異なる独立した標本である場合、ranksum は検定統計量として最初の標本の順位和を返します。

ウィルコクソン順位和検定は、マンホイットニー U 検定と同等です。マンホイットニー U 検定は、2 つの独立した標本 X および Y の母集団中央値の等価性を検証するためのノンパラメトリック検定です。

マンホイットニー U 検定の統計量 U は、2 つの独立標本 X と Y での順序付けされた要素配置において y が x に先行する回数です。この統計量とウィルコクソン順位和統計量に次のような関係がある場合、つまり、X がサイズ n_X の標本である場合、次のようになります。

$U = W - \frac{n_{X} (n_{X} + 1)}{2} .$

z 統計量

サイズが大きい標本の場合、ranksum は z 統計量を使って検定の近似 p 値を計算します。

X と Y がそれぞれ n_X および n_Y のサイズをもつ 2 つの独立標本である場合 (n_X < n_Y)、z 統計量は次のようになります。

$z = \frac{W - E (W)}{\sqrt{V (W)}} = \frac{W - [\frac{n_{X} n_{Y} + n_{X} (n_{X} + 1)}{2}] - 0.5 * s i g n (W - E (W))}{\sqrt{\frac{n_{X} n_{Y} (n_{X} + n_{Y} + 1 - t i e s c o r)}{12}}},$

これは連続性の補正と同順位調整を伴います。ここで、tiescor は次の式で与えられます。

$t i e s c o r = \frac{2 * t i e a d j}{(n_{X} + n_{Y}) (n_{X} + n_{Y} - 1)},$

ranksum では [ranks,tieadj] = tiedrank(x,y) を使用して同順位調整値を取得します。この z 統計量の p 値は標準正規分布により取得されます。

アルゴリズム

ranksum は、x および y の NaN を欠損値として認識し、無視します。

サイズの異なる標本の中央値の両側検定の場合、ranksum は検定統計量として最初の標本の順位和を返します。

参照

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

バージョン履歴

R2006a より前に導入

参考

kruskalwallis | signrank | signtest | ttest2

ranksum

構文

説明

例

2 つの母集団の中央値の等価性に関する検定

2 つの母集団の中央値の検定統計量

中央値の増加

入力引数

x — 標本データ ベクトル

y — 標本データ ベクトル

名前と値の引数

alpha — 有意水準 0.05 (既定値) | 0 ～ 1 の範囲のスカラー値

method — p 値の計算方法 'exact' | 'approximate'

tail — 検定のタイプ 'both' (既定値) | 'right' | 'left'

出力引数

p — 検定の p 値 非負のスカラー

h — 仮説検定の結果 1 | 0

stats — 検定統計量 構造体

詳細

ウィルコクソン順位和検定

z 統計量

アルゴリズム

参照

バージョン履歴

参考

`x` — 標本データ
ベクトル

`y` — 標本データ
ベクトル

`alpha` — 有意水準
0.05 (既定値) | 0 ～ 1 の範囲のスカラー値

`method` — p 値の計算方法
`'exact'` | `'approximate'`

`tail` — 検定のタイプ
`'both'` (既定値) | `'right'` | `'left'`

`p` — 検定の p 値
非負のスカラー

`h` — 仮説検定の結果
1 | 0

`stats` — 検定統計量
構造体