ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

vartestn

等分散性に関する複数標本検定

説明

vartestn(x) は、データ ベクトル x の列が同じ分散の正規分布から派生しているという帰無仮説のバートレット検定に対して統計量の概要テーブルと箱ひげ図を返します。対立仮説は、データのすべての列の分散が同じとは限らないとします。

vartestn(x,Name,Value) は、1 つまたは複数の名前と値のペア引数で指定された追加オプションを使用して、等しくない分散の検定に対する統計量の概要テーブルと箱ひげ図を返します。たとえば、異なるタイプの仮説検定を指定するか、検定結果の表示設定を変更できます。

vartestn(x,group) は、各カテゴリカル グループのデータが同じ分散の正規分布から派生しているという帰無仮説のバートレット検定に対して統計量の概要テーブルと箱ひげ図を返します。対立仮説は、すべてのグループの分散が同じとは限らないとします。

vartestn(x,group,Name,Value) は、1 つまたは複数の名前と値のペア引数で指定された追加オプションを使用して、等しくない分散の検定に対する統計量の概要テーブルと箱ひげ図を返します。たとえば、異なるタイプの仮説検定を指定するか、検定結果の表示設定を変更できます。

p = vartestn(___) は、前の構文の入力引数のいずれかを使用して、検定の p 値である p も返します。

[p,stats] = vartestn(___) は検定統計量に関する情報を含む stats 構造体も返します。

すべて折りたたむ

標本データを読み込みます。

load examgrades

学生の試験の採点データの行列 grades の 5 つの列において分散が等しいという帰無仮説を検定します。

vartestn(grades)

ans = 7.9086e-08

p 値が小さいので (p = 0)、少なくとも 1 つの列で分散が異なるという対立仮説が支持され、5 つの列すべてで分散が等しいという帰無仮説は vartestn によって棄却されることがわかります。

標本データを読み込みます。

load carsmall

ガロンあたりの走行マイル数 (MPG) の分散が、異なるモデル年において等しいという帰無仮説を検定します。

vartestn(MPG,Model_Year)

ans = 0.8327

p 値が大きいので (p = 0.83269)、ガロンあたりのマイル数 (MPG) の分散は異なるモデル年度で等しいという帰無仮説を vartestn が棄却しないことがわかります。

標本データを読み込みます。

load carsmall

リーベンの検定を使用して、ガロンあたりの走行マイル数 (MPG) の分散が、異なるモデル年において等しいという帰無仮説を検定します。

p = vartestn(MPG,Model_Year,'TestType','LeveneAbsolute')

p = 0.6320

p 値が大きいので (p = 0.63195)、ガロンあたりのマイル数 (MPG) の分散は異なるモデル年度で等しいという帰無仮説を vartestn が棄却しないことがわかります。

標本データを読み込みます。

load examgrades

ブラウン・フォーサイス検定を使用して、学生の試験の採点データの行列 grades の 5 つの列において分散が等しいという帰無仮説を検定します。統計量の概要テーブルと箱ひげ図を非表示にします。

[p,stats] = vartestn(grades,'TestType','BrownForsythe','Display','off')
p = 1.3121e-06
stats = struct with fields:
    fstat: 8.4160
       df: [4 595]

p 値が小さいので (p = 1.3121e-06)、少なくとも 1 つの列で分散が異なるという対立仮説が支持され、5 つの列すべてで分散が等しいという帰無仮説は vartestn によって棄却されることがわかります。

入力引数

すべて折りたたむ

標本データ。行列または列ベクトルを指定します。グループ化変数 group が指定されている場合、x は列ベクトルでなければなりません。グループ化変数が指定されていない場合、x は行列でなければなりません。どちらの場合でも、vartestnNaN 値を欠損値として認識し、無視します。

データ型: single | double

グループ化変数。x の各要素に対して 1 つずつ行がある categorical 配列、logical ベクトル、数値ベクトル、文字配列、string 配列、または文字ベクトルの cell 配列を指定します。グループ化変数の一意な各値によってグループが定義されます。vartestn は、NaN 値を欠損値として扱い、無視します。

たとえば、Gender'Male' および 'Female' という値をもつ文字ベクトルの cell 配列である場合、Gender をグループ化変数として使用してデータを性別にテストすることができます。

例: Gender

データ型: カテゴリカル | single | double | logical | string | cell | char

名前と値のペアの引数

オプションの Name,Value 引数のコンマ区切りペアを指定します。Name は引数名で、Value は対応する値です。Name は引用符で囲まなければなりません。Name1,Value1,...,NameN,ValueN のように、複数の名前と値のペアの引数を、任意の順番で指定できます。

例: 'TestType','BrownForsythe','Display','off' はブラウン・フォーサイス検定を指定し、結果のプロットを省略します。

検定結果の表示設定。'Display' と、以下のいずれかで構成されるコンマ区切りのペアとして指定します。

'on'箱ひげ図と要約統計のテーブルを表示します。
'off'箱ひげ図と要約統計のテーブルを表示しません。

例: 'display','off'

実行する仮説検定のタイプ。'TestType' と、以下のいずれかで構成されるコンマ区切りのペアとして指定します。

'Bartlett'バートレット検定。
'LeveneQuadratic'グループ平均からのデータ値の二乗偏差に対して ANOVA を実行して計算されるリーベンの検定。
'LeveneAbsolute'グループ平均からのデータ値の絶対偏差に対して ANOVA を実行して計算されるリーベンの検定。
'BrownForsythe'グループ中央値からのデータ値の絶対偏差に対して ANOVA を実行して計算されるブラウン・フォーサイス検定。
'OBrien'W = 0.5 を使用したリーベンの検定のオブライエンの変更。

例: 'TestType','OBrien'

出力引数

すべて折りたたむ

検定の p 値。[0,1] の範囲のスカラー値として返されます。p は、帰無仮説に基づく観測値と同様に、極端な検定統計量、またはより極端な検定統計量が観測される確率です。p の値が小さい場合、帰無仮説の妥当性に問題がある可能性があります。

仮説検定の検定統計量。以下を含む構造体として返されます。

  • chistat: 検定統計量の値

  • df: 検定の自由度

詳細

すべて折りたたむ

バートレットの検定

バートレットの検定は、少なくとも 2 つのデータ標本の分散が等しくないという対立仮説に対して、複数のデータ標本の分散が等しいかどうかを検定するために使用します。

検定統計量は次のようになります。

T=(Nk)lnsp2i=1k(Ni1)lnsi21+(1/(3(k1)))((i=1k1/(Ni1))1/(Nk)),

ここで、si2 は i 番目のグループの分散、N は全体の標本サイズ、Ni は i 番目のグループの標本サイズ、k はグループ数、sp2 はプールした分散です。プールした分散は次のように定義されます。

sp2=i=1k(Ni1)si2/(Nk).

検定統計量には、帰無仮説の場合、k – 1 の自由度をもつカイ二乗分布があります。

バートレットの検定は、正規性からの乖離に敏感です。データが非正規分布から派生している場合は、リーベンの検定を使用すると、より正確な結果が得られる可能性があります。

リーベン、ブラウン・フォーサイス、オブライエンの検定

リーベン、ブラウン・フォーサイスおよびオブライエンの検定は、少なくとも 2 つのデータ標本の分散が等しくないという対立仮説に対して、複数のデータ標本の分散が等しいかどうかを検定するために使用します。

検定統計量は次のようになります。

W=(Nk)i=1kNi(Z¯i.Z¯..)2(k1)i=1kj=1Ni(ZijZ¯i.)2,

ここで、Ni は i 番目のグループの標本サイズ、k はグループ数です。TestType の名前と値のペア引数で指定された検定のタイプによっては、Zij に次の 4 つの定義のいずれかが含まれる可能性があります。

  • LeveneAbsolute を指定した場合、vartestnZij=|YijY¯i.| を使用します。ここで、Y¯i. は i 番目のサブグループの平均です。

  • LeveneQuadratic を指定した場合、vartestnZij2=(YijY¯i.)2 を使用します。ここで、Y¯i. は i 番目のサブグループの平均です。

  • BrownForsythe を指定した場合、vartestnZij=|YijY˜i.| を使用します。ここで、Y˜i. は i 番目のサブグループの中央値です。

  • OBrien を指定した場合、vartestn

    Zij=(0.5+ni2)ni(yijy¯i)20.5(ni1)σi2(ni1)(ni2),

    を使用します。ここで、ni は i 番目のグループのサイズ、σi2 は標本の分散です。

すべての場合において、検定統計量には、k – 1 の分子の自由度と N – k の分母の自由度をもつ F 分布があります。

リーベン、ブラウン・フォーサイスおよびオブライエンの検定は、バートレットの検定と比較すると、正規性からの逸脱について感応度が低いため、標本が非正規分布から派生していることが疑わしい場合に使用する代替方法として役立ちます。

R2006a より前に導入