compare
クラス: GeneralizedLinearMixedModel
一般化線形混合効果モデルの比較
説明
は、1 番目の入力モデル results = compare(glme,altglme,CheckNesting=checknesting)glme が 2 番目の入力モデル altglme に入れ子になっているかどうかを調べます。
入力引数
一般化線形混合効果モデル。GeneralizedLinearMixedModel オブジェクトとして指定します。このオブジェクトのプロパティとメソッドについては、GeneralizedLinearMixedModel を参照してください。
fitglme を使用して、一般化線形混合効果モデルを標本データに当てはめて GeneralizedLinearMixedModel オブジェクトを作成することができます。正規分布以外の応答分布をもつ 2 つのモデルに有効な尤度比検定を実行するには、両方のモデルを "ApproximateLaplace" または "Laplace" 近似メソッドを使用して当てはめなくてはなりません。"MPL" または "REMPL" を使用して当てはめる、正規分布以外の応答分布となるモデルは、尤度比検定を使用して比較できません。
代替一般化線形混合効果モデル。GeneralizedLinearMixedModel オブジェクトとして指定します。altglme は glme と同じ応答ベクトルに当てはめますが、モデル仕様は異なっています。altglme の一部のモデル パラメーターを 0 などの固定値に設定して、glme を altglme から取得できるように glme を altglme において入れ子にしなければなりません。
fitglme を使用して、一般化線形混合効果モデルを標本データに当てはめて GeneralizedLinearMixedModel オブジェクトを作成することができます。正規分布以外の応答分布をもつ 2 つのモデルに有効な尤度比検定を実行するには、両方のモデルを "ApproximateLaplace" または "Laplace" 近似メソッドを使用して当てはめなくてはなりません。"MPL" または "REMPL" を使用して当てはめる、正規分布以外の応答分布となるモデルは、尤度比検定を使用して比較できません。
出力引数
例
標本データを読み込みます。
load mfrこのシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果をテストするため、同社は実験に参加させる 20 工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。
新しいプロセスがバッチに使用されたかどうかを示すフラグ (
newprocess)各バッチの処理時間。時間単位 (
time)バッチの温度。摂氏 (
temp)バッチに使用する化学薬品の供給業者を示すカテゴリカル変数 (
supplier)バッチ内の欠陥数 (
defects)
またデータに含まれる time_dev と temp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。
固定効果予測子として newprocess、time_dev、temp_dev および supplier を使用して固定効果専用モデルを当てはめます。応答分布にポアソンを、リンク関数に対数を、近似メソッドにラプラスを指定します。ダミー変数エンコードを 'effects' として指定すると、ダミー変数の係数の合計が 0 になります。
FEglme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');
同じ固定効果予測子、応答分布、リンク関数および近似メソッドを使用する 2 番目のモデルによる当てはめを実行します。今回は factory 別にグループ化された変量効果の切片を含めます。これは工場特有の変動に起因して品質に差がある可能性を考慮するためです。
欠陥数はポアソン分布を使用してモデル化できます
これは一般化線形混合効果モデルに対応します
ここで
は、バッチ 処理中の工場 で実行されたバッチで観測された欠陥数です。
は、バッチ () 処理中の工場 () に対応する欠陥の平均数です。
、 および は、バッチ 処理中の工場 に対応する各変数の測定値です。たとえば は、工場 で実行されたバッチ 処理中に新プロセスが使用されたかどうかを示します。
および はエフェクト (ゼロサム) コーディングを使用するダミー変数であり、バッチ 処理中に工場 で実行されたバッチに対して、それぞれ会社
CまたはBが加工化学薬品を供給したかどうかを示します。は、工場特有の品質変動に相当する、各工場 の変量効果の切片です。
glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');
理論的尤度比検定法を使用して 2 つのモデルを比較します。'CheckNesting' を true として指定すると、compare は入れ子要件が満たされていない場合に警告を返します。
results = compare(FEglme,glme,'CheckNesting',true)results =
Theoretical Likelihood Ratio Test
Model DF AIC BIC LogLik LRStat deltaDF pValue
FEglme 6 431.02 446.65 -209.51
glme 7 416.35 434.58 -201.17 16.672 1 4.4435e-05
compare はエラーを返さなかったため、入れ子要件は満たされています。小さい 値は、観測された応答ベクトルがモデル FEglme により生成されたという帰無仮説が compare により棄却され、代わりに代替モデル glme が採択されることを示します。glme に対する AIC と BIC の値の方が小さいことも、glme の方が応答により当てはまるモデルを提供するという結論を裏付けています。
詳細
"尤度比検定" は 2 つの入れ子モデルの仕様を比較するため、パラメーターによって制限されずに拡張されたモデルで制限の有意性を評価します。帰無仮説 H0 の場合、尤度比検定統計は、自由度が deltaDF の近似カイ二乗参照分布になります。
2 つのモデルを比較するとき、compare は、観測される尤度比検定統計とこのカイ二乗参照分布を比較して、尤度比検定の p 値を計算します。p 値が小さい場合は H1 を優先して H0 は棄却され、代替モデル altglme が採択されます。一方、p 値が大きい場合は、H0 が棄却できないことを示し、モデル altglme を採択するのに十分な証拠がないことを反映しています。
尤度比検定を使用して取得される p 値は、変量効果の項の有無について検定する場合は保守的になり、固定効果の項の有無について検定する場合は保守的でなくなる可能性もあります。代わりに、fixedEffects または coefTest メソッドを固定効果の検定に使用してください。
GLME モデルに有効な尤度比検定を実行するには、両方のモデルはラプラスまたは近似ラプラス近似メソッドを使用して当てはめなければなりません。疑似最尤 (MPL) または制限付き疑似最尤 (REMPL) メソッドを使用して当てはめたモデルは尤度比検定を使用して比較することはできません。MPL を使用して当てはめたモデルを比較する場合、尤度比検定に使用されるのは、疑似尤度の最後の反復からの疑似データが、最大化された対数尤度です。MPL を使用して当てはめた非正規分布のモデルを比較する場合、compare から発生する警告により、尤度比検定で使用されるのは、疑似尤度の最後の反復からの疑似データが、最大化された対数尤度であることを示します。尤度比検定で真の最大化された対数尤度を使用するには、モデルを比較する前に、近似ラプラスまたはラプラスを使用して glme と altglme の両方を当てはめなければなりません。
有効な尤度比検定を実行するには、glme が altglme に入れ子になっていなければなりません。CheckNesting=true 引数は以下の要件を確認し、満たさないものが 1 つでもあるとエラーを返します。
両方のモデル (
glmeとaltglme) を"ApproximateLaplace"または"Laplace"近似メソッドを使用して当てはめなければなりません。"MPL"または"REMPL"を使用して当てはめた GLME モデルは、尤度比検定を使用して比較することはできません。どちらのモデルも同じ応答ベクトル、応答分布およびリンク関数を使用して当てはめなければなりません。
小さい方のモデル (
glme) は大きい方のモデル (altglme) の内部に入れ子にしなければなりません。altglmeの一部のモデル パラメーターを 0 などの固定値に設定すると、glmeをaltglmeから取得できるようになります。大きい方のモデル (
altglme) の最大化された対数尤度は、小さい方のモデル (glme) の最大化された対数尤度以上でなければなりません。glmeの当てはめに使用された重みベクトルとaltglmeは同一でなければなりません。大きい方のモデル (
altglme) の変量効果の計画行列には、小さい方のモデル (glme) の変量効果の計画行列が含まれなければなりません。大きい方のモデル (
altglme) の固定効果の計画行列には、小さい方のモデル (glme) の固定効果の計画行列が含まれなければなりません。
"赤池情報量基準" (AIC) は AIC = –2logLM + 2(param) です。
logLM はモデルの当てはめに使用する方法に依存します。
'Laplace'または'ApproximateLaplace'を使用する場合、logLM は最大化された対数尤度です。'MPL'を使用する場合、logLM は疑似尤度の最後の反復による疑似データに対する最大化された対数尤度です。'REMPL'を使用する場合、logLM は疑似尤度の最後の反復による疑似データに対する最大化された制限付き対数尤度です。
param はモデル内で推定されたパラメーターの総数です。ほとんどの GLME モデルで、param は nc + p + 1 に等しくなります。ここで、nc は残差分散を除く変量効果共分散のパラメーターの総数、p は固定効果係数の個数です。ただし、二項分布またはポアソン分布で分散パラメーターが 1.0 に固定されている場合、param は (nc + p) に等しくなります。
"ベイズ情報量基準" (BIC) は BIC = –2*logLM + ln(neff)(param) です。
logLM はモデルの当てはめに使用する方法に依存します。
'Laplace'または'ApproximateLaplace'を使用する場合、logLM は最大化された対数尤度です。'MPL'を使用する場合、logLM は疑似尤度の最後の反復による疑似データに対する最大化された対数尤度です。'REMPL'を使用する場合、logLM は疑似尤度の最後の反復による疑似データに対する最大化された制限付き対数尤度です。
neff は有効な観測値の個数です。
'MPL'、'Laplace'または'ApproximateLaplace'を使用する場合、neff = n になります。ここで、n は観測値の個数です。'REMPL'を使用する場合、neff = n – p になります。
param はモデル内で推定されたパラメーターの総数です。ほとんどの GLME モデルで、param は nc + p + 1 に等しくなります。ここで、nc は残差分散を除く変量効果共分散のパラメーターの総数、p は固定効果係数の個数です。ただし、二項分布またはポアソン分布で分散パラメーターが 1.0 に固定されている場合、param は (nc + p) に等しくなります。
逸脱度の値が小さいほど、近似が優れていることを意味します。逸脱度の値が小さくなると、AIC および BIC も小さくなる傾向があります。AIC と BIC のどちらにも、推定されるパラメーターの数 p に基づくペナルティ項が含まれます。したがって、パラメーターの数が増えると、AIC および BIC の値も大きくなる傾向があります。異なるモデルを比較するときは、AIC または BIC の値が最も小さいモデルが最良近似のモデルと考えられます。
'MPL' および 'REMPL' を使用して当てはめたモデルの場合、AIC および BIC は疑似尤度の最後の反復から派生した疑似データの対数尤度 (または制限付き対数尤度) に基づきます。したがって、'MPL' と 'REMPL' を使用して当てはめたモデル間で AIC と BIC の値を直接比較するのは適切ではありません。
MATLAB Command
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
Web サイトの選択
Web サイトを選択すると、翻訳されたコンテンツにアクセスし、地域のイベントやサービスを確認できます。現在の位置情報に基づき、次のサイトの選択を推奨します:
また、以下のリストから Web サイトを選択することもできます。
最適なサイトパフォーマンスの取得方法
中国のサイト (中国語または英語) を選択することで、最適なサイトパフォーマンスが得られます。その他の国の MathWorks のサイトは、お客様の地域からのアクセスが最適化されていません。
南北アメリカ
- América Latina (Español)
- Canada (English)
- United States (English)
ヨーロッパ
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)