Main Content

devianceTest

一般化線形回帰モデルの逸脱度の分析

説明

tbl = devianceTest(mdl) は、一般化線形回帰モデル mdl の逸脱度分析テーブルを返します。tbl は、モデル mdl が定数モデルよりも大幅に良好な近似をしているかどうかの検定結果を示します。

すべて折りたたむ

一般化線形回帰モデルで逸脱度検定を実行します。

基となる 2 つの予測子 X(:,1) および X(:,2) のポアソン乱数を使って標本データを生成します。

rng('default') % For reproducibility
rndvars = randn(100,2);
X = [2 + rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

ポアソン データの一般化線形回帰モデルを作成します。

mdl = fitglm(X,y,'y ~ x1 + x2','Distribution','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

モデルが定数と統計的に著しく異なるかどうかを検定します。

tbl = devianceTest(mdl)
tbl=2×4 table
                             Deviance     DFE     chi2Stat     pValue
                            __________    ___    __________    ______

    log(y) ~ 1              2.9544e+05    99                         
    log(y) ~ 1 + x1 + x2         107.4    97     2.9533e+05       0  

小さい p 値は、モデルが定数と大きく異なっていることを示します。mdl のモデル表示では、表の 2 番目の行に統計量が示されていることに注意してください。

入力引数

すべて折りたたむ

一般化線形回帰モデル。fitglm または stepwiseglm を使用して作成した GeneralizedLinearModel オブジェクト、または compact を使用して作成した CompactGeneralizedLinearModel オブジェクトとして指定します。

出力引数

すべて折りたたむ

要約統計量の逸脱度の分析。table として返されます。

tbl には、定数モデルとモデル mdl に対する統計量の逸脱度の分析が格納されます。この table には、各モデルについて以下の列が含まれています。

説明
Deviance

逸脱度は対応するモデル (mdl または定数) の対数尤度と飽和モデルの対数尤度の差の 2 倍です。詳細は、逸脱度を参照してください。

DFE

誤差 (残差) の自由度。n – p に等しくなります。ここで、n は観測値の個数、p は推定された係数の個数です。

chi2Stat

F 統計量またはカイ二乗統計量。分散が推定される場合は F 統計量、そうでない場合はカイ二乗統計量です。

  • F 統計量は定数モデルの逸脱度と完全なモデルの逸脱度の差を推定値の分散で除算した値です。

  • "カイ二乗統計量" は定数モデルの逸脱度と完全なモデルの逸脱度の差です。

pValue

検定に関連付けられた p 値。自由度が p – 1 であるカイ二乗統計量、または分子の自由度が p – 1 で分母の自由度が DFE である F 統計量。ここで、p は推定された係数の個数です。

詳細

すべて折りたたむ

逸脱度

逸脱度は、残差二乗和を汎化したものです。飽和モデルと比較した適合度を測定します。

モデル M1 の逸脱度は、モデル M1 の対数尤度と飽和モデル Ms の対数尤度の差の 2 倍です。飽和モデルは、推定可能な最大数のパラメーターを含むモデルです。

たとえば、n 個の観測値 (yi, i = 1, 2, ..., n) があり、XiTβ の値が異なる可能性がある場合、n 個のパラメーターを含む飽和モデルを定義できます。L(b,y) がパラメーター b をもつモデルの尤度関数の最大値を示しているものとします。この場合、モデル M1 の逸脱度は以下のようになります。

2(logL(b1,y)logL(bS,y)),

ここで、b1 および bs には、それぞれモデル M1 および飽和モデルの推定パラメーターが含まれます。逸脱度は自由度 n – p のカイ二乗分布になります。ここで、n は飽和モデルのパラメーター数、p はモデル M1 のパラメーター数です。

2 つの異なる一般化線形回帰モデル M1 および M2 があり、M1 は M2 内の項のサブセットをもつと仮定します。モデルの当てはめは、それらの逸脱度 D1 と D2 を比較することによって評価できます。逸脱度の差異は以下のとおりです。

D=D2D1=2(logL(b2,y)logL(bS,y))+2(logL(b1,y)logL(bS,y))=2(logL(b2,y)logL(b1,y)).

差異 D は漸近的にカイ二乗分布となりますが、その自由度 v は、M1 および M2 で推定されたパラメーター数の差異に等しくなります。この検定の p 値は 1 — chi2cdf(D,v) を使用して取得できます。

通常は、定数項をもち予測子をもたないモデル M2 を使用して D を調べます。そのため、D は自由度が p – 1 のカイ二乗分布となります。分散を推定する場合、推定された分散で除算した差異は、分子の自由度が p – 1、分母の自由度が n – p の F 分布となります。

拡張機能

バージョン履歴

R2012a で導入