Main Content

testDeviance

多項回帰モデルの逸脱度検定

R2023a 以降

    説明

    p = testDeviance(mdl) は、MultinomialRegression モデル オブジェクト mdl の当てはめられたモデルが切片のみのモデルよりも有意に優れているかどうかを判定する検定の p 値を返します。

    [p,testStat] = testDeviance(mdl) は、p 値の生成に使用された検定統計量の値も返します。

    すべて折りたたむ

    標本データ セット fisheriris を読み込みます。

    load fisheriris

    列ベクトル species には、3 種類のアヤメの種 (setosa、versicolor、virginica) が格納されています。行列 meas には、花に関する 4 種類の測定値、がく片の長さと幅 (cm) と花弁の長さと幅 (cm) が格納されています。

    meas を予測子データ、species を応答データとして使用して、多項回帰モデルを当てはめます。

    mdl = fitmnr(meas,species);

    mdl は、ノミナル多項回帰モデルをデータに当てはめた結果を含む多項回帰モデル オブジェクトです。

    切片のみのモデルの性能がモデル mdl と同等であるという帰無仮説についてのカイ二乗検定を実行します。

    p = testDeviance(mdl)
    p = 7.0555e-64
    

    "p" 値が小さく、この帰無仮説を棄却して mdl の方が切片のみのモデルよりも性能が優れていると結論付けるだけの十分な証拠があることを示しています。

    標本データ セット carbig を読み込みます。

    load carbig

    変数 MPG および Origin には、自動車の燃費と生産国のデータがそれぞれ格納されています。

    MPG を予測子データ、Origin を応答として、多項回帰モデルを当てはめます。当てはめ時に分散パラメーターを推定します。

    mdl = fitmnr(MPG,Origin,EstimateDispersion=true);

    mdl は、ノミナル多項回帰モデルをデータに当てはめた結果を含む多項回帰モデル オブジェクトです。

    切片のみのモデルのデータの適合度がモデル mdl と同等であるという帰無仮説についての "F" 検定を実行します。"p" 値と "F" 統計量を表示します。

    [p,tStats] = testDeviance(mdl)
    p = 1.2314e-45
    
    tStats = 39.1789
    

    "p" 値が小さく、この帰無仮説を棄却して mdl の方が切片のみのモデルよりも性能が優れていると結論付けるだけの十分な証拠があることを示しています。

    入力引数

    すべて折りたたむ

    多項回帰モデル オブジェクト。関数 fitmnr で作成される MultinomialRegression モデル オブジェクトとして指定します。

    出力引数

    すべて折りたたむ

    逸脱度検定の p 値。範囲 [0,1] の数値スカラーとして返されます。

    逸脱度検定の統計量。数値スカラーとして返されます。mdl.Dispersion が推定されている場合、testDeviance は当てはめられたモデル mdl が切片のみのモデルよりも優れているかどうかを判定する F 検定を実行します。mdl.Dispersion が推定されていない場合、testDeviance は代わりにカイ二乗検定を実行します。

    詳細

    すべて折りたたむ

    逸脱度

    逸脱度は、残差二乗和を汎化したものです。飽和モデルと比較した適合度を測定します。

    モデル M1 の逸脱度は、モデル M1 の対数尤度と飽和モデル Ms の対数尤度の差の 2 倍です。飽和モデルは、推定可能な最大数のパラメーターを含むモデルです。

    たとえば、n 個の観測値 (yi, i = 1, 2, ..., n) があり、XiTβ の値が異なる可能性がある場合、n 個のパラメーターを含む飽和モデルを定義できます。L(b,y) がパラメーター b をもつモデルの尤度関数の最大値を示しているものとします。この場合、モデル M1 の逸脱度は以下のようになります。

    2(logL(b1,y)logL(bS,y)),

    ここで、b1 および bs には、それぞれモデル M1 および飽和モデルの推定パラメーターが含まれます。逸脱度は自由度 n – p のカイ二乗分布になります。ここで、n は飽和モデルのパラメーター数、p はモデル M1 のパラメーター数です。

    2 つの異なる一般化線形回帰モデル M1 および M2 があり、M1 は M2 内の項のサブセットをもつと仮定します。モデルの当てはめは、それらの逸脱度 D1 と D2 を比較することによって評価できます。逸脱度の差異は以下のとおりです。

    D=D2D1=2(logL(b2,y)logL(bS,y))+2(logL(b1,y)logL(bS,y))=2(logL(b2,y)logL(b1,y)).

    差異 D は漸近的にカイ二乗分布となりますが、その自由度 v は、M1 および M2 で推定されたパラメーター数の差異に等しくなります。この検定の p 値は 1 — chi2cdf(D,v) を使用して取得できます。

    通常は、定数項をもち予測子をもたないモデル M2 を使用して D を調べます。そのため、D は自由度が p – 1 のカイ二乗分布となります。分散を推定する場合、推定された分散で除算した差異は、分子の自由度が p – 1、分母の自由度が n – p の F 分布となります。

    代替機能

    coefTest は、mdl の係数推定値がゼロであるかどうかを判定する F 検定を実行します。検定する係数を指定しない場合、coefTest は、モデル mdl の方が係数のないモデルよりもデータの適合度が高いかどうかを検定します。

    バージョン履歴

    R2023a で導入