Main Content

coefTest

一般化線形回帰モデルの係数に対する線形仮説検定

説明

p = coefTest(mdl) は、mdl 内の係数推定値が切片項を除いてすべてゼロであるかどうかに対する F 検定の p 値を計算します。

p = coefTest(mdl,H) は、H × B = 0 に対する F 検定を実行します。B は係数ベクトルを表します。H を使用して、F 検定に含める係数を指定します。

p = coefTest(mdl,H,C) は、H × B = C に対する F 検定を実行します。

[p,F] = coefTest(___) は、前の構文におけるいずれかの入力引数の組み合わせを使用して、F 検定統計量 F も返します。

[p,F,r] = coefTest(___) は、検定に対する分子の自由度 r も返します。

すべて折りたたむ

一般化線形回帰モデルを当てはめ、当てはめたモデルの係数が 0 と差があるかどうかを検定します。

基となる 2 つの予測子 X(:,1) および X(:,2) のポアソン乱数を使って標本データを生成します。

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

ポアソン データの一般化線形回帰モデルを作成します。

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

近似モデルの係数に 0 と有意差があるかどうかを検定します。

p = coefTest(mdl)
p = 4.1131e-153

p 値が小さいので、このモデルの方が切片項のみから構成される縮退したモデルより有意に優れていることがわかります。

一般化線形回帰モデルを当てはめ、当てはめたモデルにおける指定した係数の有意性を検定します。

基となる 2 つの予測子 X(:,1) および X(:,2) のポアソン乱数を使って標本データを生成します。

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

ポアソン データの一般化線形回帰モデルを作成します。

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

係数 x1 の有意性を検定します。モデル表示によると、x1 は 2 番目の予測子です。数値インデックス ベクトルを使用して、係数を指定します。

p = coefTest(mdl,[0 1 0])
p = 2.8681e-145

返された p 値は、当てはめたモデルでは x1 が統計的に有意であることを示します。

入力引数

すべて折りたたむ

一般化線形回帰モデル。fitglm または stepwiseglm を使用して作成した GeneralizedLinearModel オブジェクト、または compact を使用して作成した CompactGeneralizedLinearModel オブジェクトとして指定します。

仮説行列。r 行 s 列のフルランク数値インデックス行列として指定します。ここで、r は検定する係数の線形結合の個数、s は係数の総数です。

  • H を指定した場合、出力 pH × B = 0 に対する F 検定の p 値です。B は係数ベクトルを表します。

  • HC を指定した場合、出力 pH × B = C に対する F 検定の p 値です。

例: [1 0 0 0 0] は、5 つの係数のうち 1 番目の係数を検定します。

データ型: single | double

帰無仮説を検定するための仮定値。H と同じ行数の数値ベクトルを指定します。

HC を指定した場合、出力 pH × B = C に対する F 検定の p 値です。B は係数ベクトルを表します。

データ型: single | double

出力引数

すべて折りたたむ

F 検定の p 値。範囲 [0,1] の数値として返されます。

F 検定の検定統計量の値。数値として返されます。

F 検定の分子の自由度。正の整数として返されます。F 統計量では、分子の自由度が r、分母の自由度が mdl.DFE です。

アルゴリズム

p 値、F 統計量、および分子の自由度は、次の仮定の下で有効です。

  • データは、当てはめたモデルの Formula プロパティの式によって表されるモデルから派生する。

  • 観測値は独立しており、予測子の値の影響を受ける。

これらの仮定のもとで、β が線形回帰の (未知の) 係数ベクトルを表すとします。H は r 行 s 列のフルランク数値インデックス行列であるとします。ここで、r は検定する係数の線形結合の個数、s は係数の総数です。c は r 行の列ベクトルとします。Hβ = c という仮説に対する検定統計量は次のようになります。

F=(Hβ^c)(HVH)1(Hβ^c)/r.

ここで、β^ は係数ベクトル β の推定値 (Coefficients プロパティに格納されます)、V は係数推定値の推定共分散 (CoefficientCovariance プロパティに格納されます) です。仮説が真である場合、検定統計量 F は自由度 r および u をもつF 分布に従います。u は誤差の自由度であり、DFE プロパティに格納されます。

代替機能

よく使用される検定統計量の値は、当てはめたモデルの Coefficients プロパティで利用可能です。

拡張機能

バージョン履歴

R2012a で導入