ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

anova

クラス: GeneralizedLinearMixedModel

一般化線形混合効果モデルの分散分析

構文

stats = anova(glme)
stats = anova(glme,Name,Value)

説明

stats = anova(glme) はテーブル stats を返します。これは、一般化線形混合効果モデル glme の各固定効果項を表すすべての係数が 0 に等しいかどうかを判定する F 検定の結果を含みます。

stats = anova(glme,Name,Value) では、1 つ以上の Name,Value ペアの引数で指定された追加オプションを使用して、テーブル stats を返します。たとえば、F 検定に対する分母の自由度の近似を計算する方法を指定できます。

入力引数

すべて展開する

一般化線形混合効果モデル。GeneralizedLinearMixedModel オブジェクトとして指定します。このオブジェクトのプロパティとメソッドについては、GeneralizedLinearMixedModel を参照してください。

名前と値のペアの引数

オプションの引数 Name,Value のコンマ区切りペアを指定します。Name は引数名で、Value は対応する値です。Name は引用符で閉じなければなりません。Name1,Value1,...,NameN,ValueN のように、複数の名前と値のペアの引数を任意の順序で指定できます。

F 検定で使用する分母の自由度の近似の計算方法。'DFMethod' と次のいずれかの値で構成されるコンマ区切りのペアとして指定します。

説明
'residual'自由度は定数で n – p に等しいと仮定されます。ここで n は観測値の数、p は固定効果の数です。
'none'すべての自由度は無限大に設定されます。

F 統計の分母の自由度は出力構造体 stats の列 DF2 に対応します。

例: 'DFMethod','none'

出力引数

すべて展開する

固定効果項に対する F 検定の結果。glme の各固定効果項に対して 1 行と以下の列をもつテーブルとして返されます。

列名説明
Term固定効果項の名前
FStat項の F 統計量
DF1F 統計量の分子の自由度
DF2F 統計量の分母の自由度
pValue項の p 値

それぞれの固定効果項は連続変数、グループ化変数または 2 つ以上の連続変数またはグループ化変数間の交互作用のいずれかです。anova は固定効果の項ごとに、固定効果の項を表すすべての係数が 0 であるかを判定する F 検定 (周辺検定) を行います。

タイプ III 仮説の検定で一般化線形混合効果モデル fitglme をあてはめる場合、名前と値のペアの引数 'DummyVarCoding' に対し 'effects' 対比を使用しなければなりません。

すべて展開する

標本データを読み込みます。

load mfr

このシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果を検定する実験のため、参加させる 20 件の工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。

  • 新しいプロセスがバッチに使用されたかどうかを示すフラグ (newprocess)

  • 各バッチの処理時間。時間単位 (time)

  • バッチの温度。摂氏 (temp)

  • バッチで使用する化学薬品の供給業者 (AB または C) を示すカテゴリカル変数 (supplier)

  • バッチ内の欠陥数 (defects)

またデータに含まれる time_devtemp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。

固定効果予測子として newprocesstime_devtemp_dev および supplier を使用して一般化線形混合効果モデルを近似します。工場特有の変動に起因して品質に差がある可能性を考慮するために、factory 別にグループ化された切片の変量効果項を含めます。応答変数 defects はポアソン分布であり、このモデルの適切なリンク関数は対数です。係数の予測にラプラス近似メソッドを使用します。ダミー変数エンコードを 'effects' として指定すると、ダミー変数の係数の合計が 0 になります。

欠陥数はポアソン分布を使用してモデル化できます

これは一般化線形混合効果モデルに対応します

ここで、

  • は、バッチ 処理中の工場 で実行されたバッチで観測された欠陥数です。

  • は、バッチ (ここで ) 処理中の工場 (ここで ) に対応する欠陥の平均数です。

  • および は、バッチ 処理中の工場 に対応する各変数の測定値です。たとえば は、バッチ 処理中の工場 で実行されたバッチで新プロセスが使用されたかどうかを示します。

  • および は効果 (合計はゼロ) の符号化を使用するダミー変数であり、バッチ 処理中の工場 で実行されたバッチに対して、それぞれ会社 C または B が加工化学薬品を供給したかどうかを示します。

  • は、工場特有の品質変動に相当する、各工場 の変量効果の切片です。

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)',...
'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects')
glme = 
Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                 Estimate     SE          tStat       DF    pValue    
    '(Intercept)'           1.4689     0.15988      9.1875    94    9.8194e-15
    'newprocess'          -0.36766     0.17755     -2.0708    94      0.041122
    'time_dev'           -0.094521     0.82849    -0.11409    94       0.90941
    'temp_dev'            -0.28317      0.9617    -0.29444    94       0.76907
    'supplier_C'         -0.071868    0.078024     -0.9211    94       0.35936
    'supplier_B'          0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                Name2                Type         Estimate
    '(Intercept)'        '(Intercept)'        'std'        0.31381 

Group: Error
    Name                      Estimate
    'sqrt(Dispersion)'        1       

すべての固定効果係数が 0 であるかどうかを判定するため、 検定を実行します。

stats = anova(glme)
stats = 
    ANOVA marginal tests: DFMethod = 'residual'

    Term                 FStat       DF1    DF2    pValue    
    '(Intercept)'           84.41    1      94     9.8194e-15
    'newprocess'           4.2881    1      94       0.041122
    'time_dev'           0.013016    1      94        0.90941
    'temp_dev'           0.086696    1      94        0.76907
    'supplier'            0.59212    2      94         0.5552

切片、newprocesstime_dev、および temp_dev 値は、glme の係数表の値と同じです。切片と newprocess 値が小さいので、5% の有意水準で有意な予測子であることがわかります。time_devtemp_dev 値が大きいので、この水準では有意な予測子ではないことがわかります。

supplier 値 0.5552 は、カテゴリカル変数 supplier を表す両方の係数について結合有意性の尺度となります。これは、glme 表示の係数表に示されているように、ダミー変数 supplier_C および supplier_B を含みます。大きい 値は、5% の有意水準では supplier が有意な予測子ではないことを示します。

ヒント

  • anova は固定効果の項ごとに、固定効果の項を表すすべての係数が 0 であるかを判定する F 検定 (周辺検定) を行います。

    fitglme および最尤近似メソッドの 1 つ ('Laplace' または 'ApproximateLaplace') を使用し、GLME (一般化線形混合効果) モデルを近似する場合:

    • 'CovarianceMethod' 名前と値のペアの引数を 'conditional' として指定する場合、F 検定は推定共分散パラメーターを条件とします。

    • 'CovarianceMethod' 名前と値のペアを 'JointHessian' として指定する場合、F 検定は共分散パラメーターの推定における不確実性を考慮します。

    fitglme と疑似尤度の近似メソッド ('MPL' または 'REMPL') のいずれかを使用して GLME モデルをあてはめる場合、anova は、固定効果を推定するために、疑似尤度の最後の反復から固定線形混合効果モデルを使用します。