ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

coefCI

クラス: GeneralizedLinearMixedModel

一般化線形混合効果モデルの係数の信頼区間

説明

feCI = coefCI(glme) は一般化線形混合効果モデル glme の固定効果係数の 95% 信頼区間を返します。

feCI = coefCI(glme,Name,Value) は、1 つ以上の Name,Value ペアの引数で指定された追加オプションを使用して信頼区間を返します。たとえば、自由度の近似の計算に使用する異なる信頼度または方法を指定できます。

[feCI,reCI] = coefCI(___) は、前の構文のいずれかを使用して変量効果係数の信頼区間も返します。

入力引数

すべて展開する

一般化線形混合効果モデル。GeneralizedLinearMixedModel オブジェクトとして指定します。このオブジェクトのプロパティとメソッドについては、GeneralizedLinearMixedModel を参照してください。

名前と値のペアの引数

オプションの Name,Value 引数のコンマ区切りペアを指定します。Name は引数名で、Value は対応する値です。Name は引用符で囲まなければなりません。Name1,Value1,...,NameN,ValueN のように、複数の名前と値のペアの引数を、任意の順番で指定できます。

有意水準。'Alpha' と [0,1] の範囲にあるスカラー値から構成されるコンマ区切りのペアとして指定します。値が α の場合、信頼度は 100 × (1 – α)% です。

たとえば、99% の信頼区間の場合は、次のように信頼度を指定できます。

例: 'Alpha',0.01

データ型: single | double

自由度の近似の計算方法。'DFMethod' と次のいずれかの値で構成されるコンマ区切りのペアとして指定します。

説明
'residual'自由度の値は n - p に等しい定数であると仮定されます。n は観測値の個数、p は固定効果の個数です。
'none'自由度は無限大に設定されます。

例: 'DFMethod','none'

出力引数

すべて展開する

固定効果の信頼区間。p 行 2 列の行列として返されます。feCI には、fixedEffects メソッドによって返された p 行 1 列の固定効果ベクトルに対応する信頼限界が含まれています。feCI の 1 列目には信頼限界の下限が含まれ、2 列目には信頼限界の上限が含まれます。

fitglme および最尤近似メソッドの 1 つ ('Laplace' または 'ApproximateLaplace') を使用し、GLME モデルを近似する場合:

  • 'CovarianceMethod' の名前と値のペアの引数を 'conditional' として指定する場合、信頼区間は推定共分散パラメーターを条件とします。

  • 'CovarianceMethod' の名前と値のペアの引数を 'JointHessian' として指定する場合、信頼区間は推定共分散パラメーターの不確実性を考慮します。

fitglme と疑似尤度の近似メソッド ('MPL' または 'REMPL') を使用して GLME モデルをあてはめる場合、coefci は、固定効果の信頼区間を計算するために、疑似尤度の最後の反復からの近似線形混合効果モデルを使用します。

変量効果の信頼区間。q 行 2 列の行列として返されます。reCI には、randomEffects メソッドによって返された q 行 1 列の変量効果ベクトル B に対応する信頼限界が含まれています。reCI の 1 列目には信頼限界の下限が含まれ、2 列目には信頼限界の上限が含まれます。

fitglme と最大尤度の近似メソッド ('Laplace' または 'ApproximateLaplace') のいずれかを使用して GLME モデルをあてはめる場合、coefCI は、推定の共分散パラメーターおよび観測された応答を条件とする CMSEP (予測の条件付き平均二乗誤差) メソッドを使用して、信頼区間を計算します。あるいは、coefCI からの信頼区間は、推定された共分散パラメーターと観測された応答を条件として、近似ベイズの信頼できる区間として解釈できます。

fitglme と疑似尤度の近似メソッド ('MPL' または 'REMPL') のいずれかを使用して GLME モデルをあてはめる場合、coefci は、変量効果の信頼区間を計算するために、疑似尤度の最後の反復から近似線形混合効果モデルを使用します。

すべて展開する

標本データを読み込みます。

load mfr

このシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果を検定する実験のため、参加させる 20 件の工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。

  • 新しいプロセスがバッチに使用されたかどうかを示すフラグ (newprocess)

  • 各バッチの処理時間。時間単位 (time)

  • バッチの温度。摂氏 (temp)

  • バッチで使用する化学薬品の供給業者 (AB または C) を示すカテゴリカル変数 (supplier)

  • バッチ内の欠陥数 (defects)

またデータに含まれる time_devtemp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。

固定効果予測子として newprocesstime_devtemp_dev および supplier を使用して一般化線形混合効果モデルを近似します。工場特有の変動に起因して品質に差がある可能性を考慮するために、factory 別にグループ化された切片の変量効果項を含めます。応答変数 defects はポアソン分布であり、このモデルの適切なリンク関数は対数です。係数の予測にラプラス近似メソッドを使用します。ダミー変数エンコードを 'effects' として指定すると、ダミー変数の係数の合計が 0 になります。

欠陥数はポアソン分布を使用してモデル化できます

defectsijPoisson(μij)

これは一般化線形混合効果モデルに対応します

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

ここで、

  • defectsij は、バッチ j 処理中の工場 i で実行されたバッチで観測された欠陥数です。

  • μij は、バッチ j (j=1,2,...,5) 処理中の工場 i (i=1,2,...,20) に対応する欠陥の平均数です。

  • newprocessijtime_devij および temp_devij は、バッチ j 処理中の工場 i に対応する各変数の測定値です。たとえば newprocessij は、工場 i で実行されたバッチ j 処理中に新プロセスが使用されたかどうかを示します。

  • supplier_Cij および supplier_Bij は効果 (合計はゼロ) の符号化を使用するダミー変数であり、バッチ j 処理中に工場 i で実行されたバッチに対して、それぞれ会社 C または B が加工化学薬品を供給したかどうかを示します。

  • biN(0,σb2) は、工場特有の品質変動に相当する、各工場 i の変量効果の切片です。

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

fixedEffects を使用し、glme の固定効果係数の推定および名前を表示します。

[beta,betanames] = fixedEffects(glme)
beta = 6×1

    1.4689
   -0.3677
   -0.0945
   -0.2832
   -0.0719
    0.0711

betanames=6×1 table
        Name     
    _____________

    '(Intercept)'
    'newprocess' 
    'time_dev'   
    'temp_dev'   
    'supplier_C' 
    'supplier_B' 

beta の各行には、betanames の対応する行で名前を指定された係数の推定値が含まれます。たとえば、beta の行 3 の値 –0.0945 は、予測子変数 time_dev の推定された係数です。

固定効果係数に対する 95% 信頼区間を計算します。

feCI = coefCI(glme)
feCI = 6×2

    1.1515    1.7864
   -0.7202   -0.0151
   -1.7395    1.5505
   -2.1926    1.6263
   -0.2268    0.0831
   -0.0826    0.2247

feCI の列 1 には 95% の信頼区間の下限が含まれます。列 2 には上限が含まれます。行 1 は切片項に対応します。行 2、3 および 4 は newprocesstime_dev および temp_dev にそれぞれ対応します。行 5 および 6 は指標変数 supplier_C および supplier_B にそれぞれ対応します。たとえば、time_dev の係数に対する 95% の信頼区間は [-1.7395 , 1.5505] です。信頼区間には 0 を含むものがあり、それらの予測子が 5% の有意水準において有意でないことを示しています。各固定効果項に固有の p 値を取得するには、fixedEffects を使用します。項全体で有意性を検定するには、anova を使用します。

標本データを読み込みます。

load mfr

このシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果を検定する実験のため、参加させる 20 件の工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。

  • 新しいプロセスがバッチに使用されたかどうかを示すフラグ (newprocess)

  • 各バッチの処理時間。時間単位 (time)

  • バッチの温度。摂氏 (temp)

  • バッチで使用する化学薬品の供給業者 (AB または C) を示すカテゴリカル変数 (supplier)

  • バッチ内の欠陥数 (defects)

またデータに含まれる time_devtemp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。

固定効果予測子として newprocesstime_devtemp_dev および supplier を使用して一般化線形混合効果モデルを近似します。factory 別にグループ化された変量効果の切片を含めます。これは工場特有の変動に起因する品質に差がある可能性を考慮するためです。応答変数 defects はポアソン分布であり、このモデルの適切なリンク関数は対数です。係数の予測にラプラス近似メソッドを使用します。

欠陥数はポアソン分布を使用してモデル化できます

defectsijPoisson(μij)

これは一般化線形混合効果モデルに対応します

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

ここで、

  • defectsij は、バッチ j 処理中の工場 i で実行されたバッチで観測された欠陥数です。

  • μij は、バッチ j (j=1,2,...,5) 処理中の工場 i (i=1,2,...,20) に対応する欠陥の平均数です。

  • newprocessijtime_devij および temp_devij は、バッチ j 処理中の工場 i に対応する各変数の測定値です。たとえば newprocessij は、工場 i で実行されたバッチ j 処理中に新プロセスが使用されたかどうかを示します。

  • supplier_Cij および supplier_Bij は効果 (合計はゼロ) の符号化を使用するダミー変数であり、バッチ j 処理中に工場 i で実行されたバッチに対して、それぞれ会社 C または B が加工化学薬品を供給したかどうかを示します。

  • biN(0,σb2) は、工場特有の品質変動に相当する、各工場 i の変量効果の切片です。

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

randomEffects を使用し、factory に関連付けられた変量効果の EBP (経験的ベイズ予測子) の推定を計算し表示します。

[B,Bnames] = randomEffects(glme)
B = 20×1

    0.2913
    0.1542
   -0.2633
   -0.4257
    0.5453
   -0.1069
    0.3040
   -0.1653
   -0.1458
   -0.0816
      ⋮

Bnames=20×3 table
      Group      Level        Name     
    _________    _____    _____________

    'factory'    '1'      '(Intercept)'
    'factory'    '2'      '(Intercept)'
    'factory'    '3'      '(Intercept)'
    'factory'    '4'      '(Intercept)'
    'factory'    '5'      '(Intercept)'
    'factory'    '6'      '(Intercept)'
    'factory'    '7'      '(Intercept)'
    'factory'    '8'      '(Intercept)'
    'factory'    '9'      '(Intercept)'
    'factory'    '10'     '(Intercept)'
    'factory'    '11'     '(Intercept)'
    'factory'    '12'     '(Intercept)'
    'factory'    '13'     '(Intercept)'
    'factory'    '14'     '(Intercept)'
    'factory'    '15'     '(Intercept)'
    'factory'    '16'     '(Intercept)'
      ⋮

B の各行には、Bnames の対応する行で名前を指定された変量効果係数の推定の EBP が含まれます。たとえば、B の 3 行目の値 -0.2633 は、factory のレベル '3' について推定された '(Intercept)' の係数です。

変量効果の EBP の 99% の信頼区間を計算します。

[feCI,reCI] = coefCI(glme,'Alpha',0.01);
reCI
reCI = 20×2

   -0.2125    0.7951
   -0.3510    0.6595
   -0.8219    0.2954
   -0.9953    0.1440
    0.0730    1.0176
   -0.6362    0.4224
   -0.1796    0.7877
   -0.7044    0.3738
   -0.6795    0.3880
   -0.6142    0.4509
      ⋮

reCI の列 1 には 99% の信頼区間の下限が含まれます。列 2 には上限が含まれます。各行は、Bnames に示された順で factory のレベルに対応します。たとえば、行 3 は factory のレベル '3' における '(Intercept)' の係数に対応し、信頼区間が [-0.8219 , 0.2954] の 99% になります。各変量効果項に関連したさらなる統計については、randomEffects を使用します。

参照

[1] Booth, J.G., and J.P. Hobert. “Standard Errors of Prediction in Generalized Linear Mixed Models.” Journal of the American Statistical Association. Vol. 93, 1998, pp. 262–272.