ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

adtest

アンダーソン・ダーリング検定

構文

h = adtest(x)
h = adtest(x,Name,Value)
[h,p] = adtest(___)
[h,p,adstat,cv] = adtest(___)

説明

h = adtest(x) は、アンダーソン・ダーリング検定を使用して、ベクトル x のデータが正規分布を含む母集団から派生するという帰無仮説の検定の判定を返します。対立仮説は、x が正規分布を含む母集団から派生していないというものです。検定で帰無仮説が有意水準 5% で棄却された場合、結果 h1、それ以外の場合は 0 になります。

h = adtest(x,Name,Value) は、1 つまたは複数の名前と値のペアの引数で指定された追加のオプションによって、アンダーソン・ダーリング検定の検定の判定を返します。たとえば、正規以外の帰無分布を指定するか、p 値を計算するための代替方法を選択できます。

[h,p] = adtest(___) は、前の構文の入力引数のいずれかを使用して、アンダーソン・ダーリング検定の p 値である p も返します。

[h,p,adstat,cv] = adtest(___) は、検討統計量 adstat およびアンダーソン・ダーリング検定の棄却限界値 cv も返します。

すべて折りたたむ

標本データを読み込みます。学生の試験採点データの 1 列目が含まれているベクトルを作成します。

load examgrades
x = grades(:,1);

試験の採点は正規分布から派生するという帰無仮説を検定します。母集団パラメーターの値を指定する必要はありません。

[h,p,adstat,cv] = adtest(x)
h = logical
   0

p = 0.1854
adstat = 0.5194
cv = 0.7470

h = 0 の戻り値は、adtest が既定の有意水準 5% で帰無仮説を棄却できないことを示します。

標本データを読み込みます。学生の試験採点データの 1 列目が含まれているベクトルを作成します。

load examgrades
x = grades(:,1);

試験の採点が極値分布から派生しているという帰無仮説を検定します。母集団パラメーターの値を指定する必要はありません。

[h,p] = adtest(x,'Distribution','ev')
h = logical
   0

p = 0.0714

h = 0 の戻り値は、adtest が既定の有意水準 5% で帰無仮説を棄却できないことを示します。

標本データを読み込みます。学生の試験採点データの 1 列目が含まれているベクトルを作成します。

load examgrades
x = grades(:,1);

平均が mu = 75、標準偏差が sigma = 10 の正規確率分布オブジェクトを作成します。

dist = makedist('normal','mu',75,'sigma',10)
dist = 
  NormalDistribution

  Normal distribution
       mu = 75
    sigma = 10

x は仮定された正規分布から派生するという帰無仮説を検定します。

[h,p] = adtest(x,'Distribution',dist)
h = logical
   0

p = 0.4687

h = 0 の戻り値は、adtest が既定の有意水準 5% で帰無仮説を棄却できないことを示します。

入力引数

すべて折りたたむ

ベクトルとして指定される標本データ。NaN で示される x の欠損観測値は無視されます。

データ型: single | double

名前と値のペアの引数

オプションの引数 Name,Value のコンマ区切りペアを指定します。Name は引数名で、Value は対応する値です。Name は引用符で閉じなければなりません。Name1,Value1,...,NameN,ValueN のように、複数の名前と値のペアの引数を任意の順序で指定できます。

例: 'Alpha',0.01,'MCTol',0.01 は、1% の有意水準で仮説検定を実行し、p が 0.01 となる最大のモンテカルロ標準誤差をもつモンテカルロ シミュレーションを使用して p 値 p を決定します。

データ ベクトル x の仮定された分布。'Distribution' と以下のいずれかで構成される、コンマ区切りペアとして指定します。

'norm'正規分布
'exp'指数分布
'ev'極値分布
'logn'対数正規分布
'weibull'ワイブル分布

この場合、母集団パラメーターを指定する必要はありません。代わりに、adtest は標本データから分布パラメーターを推定し、パラメーターが未指定の選択済みの分布族から派生しているという複合仮説に対して x を検定します。

または、帰無分布に連続確率分布オブジェクトを指定することができます。この場合は、すべての分布パラメーターを指定しなければなりません。また、adtest は、指定されたパラメーターを含む特定の分布から派生するという単純仮説に対して x を検定します。

例: 'Distribution','exp'

仮説検定の有意水準。'Alpha' と、(0,1) の範囲内のスカラー値で構成されるコンマ区切りのペアとして指定します。

例: 'Alpha',0.01

データ型: single | double

p 値 p の最大モンテカルロ標準誤差'MCTol' と正のスカラー値で構成されるコンマ区切りのペアとして指定します。MCTol を使用すると、adtest はモンテカルロ シミュレーションを使用して p を決定します。名前と値のペア引数 Asymptotic には値 false が含まれなければなりません。

例: 'MCTol',0.01

データ型: single | double

アンダーソン・ダーリング検定の p 値を計算する方法。'Asymptotic' と、true または false のいずれかで構成されるコンマ区切りのペアとして指定します。'true' を指定すると、adtest は、アンダーソン・ダーリング検定統計量の極限分布を使用して p 値を推定します。false を指定すると、adtest は解析公式に基づいて p 値を計算します。標本サイズが 120 を超える場合、極限分布の推定は、小さい標本サイズの近似法よりも正確になる可能性があります。

  • Distribution 名前と値のペアの不明なパラメーターを含む分布族を指定する場合、Asymptoticfalse でなければなりません。

  • MCTol を使用してモンテカルロ シミュレーションで p 値を計算する場合、Asymptoticfalse でなければなりません。

例: 'Asymptotic',true

データ型: logical

出力引数

すべて折りたたむ

論理値として返される仮説検定の結果。

  • h = 1 の場合、有意水準 Alpha で帰無仮説が棄却されることを示します。

  • h = 0 の場合、有意水準 Alpha で帰無仮説が棄却できなかったことを示します。

[0,1] の範囲のスカラー値として返される、アンダーソン・ダーリング検定の p 値。p は、帰無仮説に基づく観測値と同様に、極端な検定統計量、またはより極端な検定統計量が観測される確率です。p は、次のいずれかの方法を使用して計算されます。

  • 仮定された分布が完全に指定された確率分布オブジェクトである場合、adtestp を解析的に計算します。'Asymptotic'true の場合、adtest は検定統計量の漸近分布を使用します。'MCTol' の値を指定した場合、adtest ではモンテカルロ シミュレーションを使用します。

  • 仮定された分布が不明なパラメーターを含む分布族として指定されている場合、adtest はテーブルから棄却限界値を取得し、逆内挿を使用して p 値を決定します。'MCTol' の値を指定した場合、adtest ではモンテカルロ シミュレーションを使用します。

アンダーソン・ダーリング検定の検定統計量。スカラー値として返されます。

  • 仮定された分布が完全に指定された確率分布オブジェクトである場合、adtest は指定されたパラメーターを使用して adstat を計算します。

  • 仮定された分布が不明なパラメーターをもつ分布族として指定されている場合、adtest は標本データから推定されたパラメーターを使用して adstat を計算します。

有意水準 Alpha のアンダーソン・ダーリング検定の棄却限界値。スカラー値として返されます。adtest は、指定された有意水準 Alpha に基づいてテーブルに内挿して cv を決定します。

詳細

すべて折りたたむ

アンダーソン・ダーリング検定

アンダーソン・ダーリング検定は、データ標本が正規分布から派生するかどうかを検定するために広く使用されています。ただし、この検定では、分布パラメーターを完全に指定しない場合でも、別の仮定された分布について検定することができます。代わりに、この検定では、データ標本から不明なパラメーターが推定されます。

この検定統計量は 2 次経験的分布関数統計の族に属します。この統計量では、順序付けられた標本値 x1<x2<...<xn に対して、仮定の分布 F(x) と経験的累積分布関数 Fn(x) の距離を次のように測定します。

n(Fn(x)F(x))w2(x)dF(x),

ここで、w(x) は重み関数、n は標本内のデータ点の数です。

アンダーソン・ダーリング検定の重み関数は次のようになります。

w(x)=[F(x)(1F(x))]1,

この関数では分布の裾にある観測値の重みが大きくなるため、外れ値に対する検定の感度が高くなり、分布の裾における正規性からの逸脱の検出が改善されます。

アンダーソン・ダーリング検定統計量は次のようになります。

An2=ni=1n2i1n[ln(F(Xi))+ln(1F(Xn+1i))],

ここで、{X1<...<Xn} は順序付けられた標本データ点、n は標本のデータ点の数です。

adtest では、帰無仮説を棄却するかどうかは、棄却限界値をもつ検定統計量の比較ではなく、有意水準が指定された仮説検定の p 値の比較に基づいて決定されます。

モンテカルロ標準誤差

モンテカルロ標準誤差は p 値のシミュレーションが原因の誤差です。

モンテカルロ標準誤差は、次のように計算されます。

SE=(p^)(1p^)mcreps,

ここで、p^ は仮説検定の推定 p 値、mcreps はモンテカルロ反復の実行数です。

adtest では、p^ のモンテカルロ標準誤差が MCTol について指定した値より小さくなるように、十分大きいモンテカルロ反復数 mcreps が選択されます。

参考

|

R2013a で導入