Main Content

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

GeneralizedLinearMixedModel クラス

一般化線形混合効果モデル クラス

説明

GeneralizedLinearMixedModel オブジェクトは、固定効果および変量効果両方を含む応答変数の回帰モデルを表します。このオブジェクトはデータ、モデルの説明、近似係数、共分散パラメーター、計画行列、残差、残差プロットおよび GLME (一般化線形混合効果) モデルのその他の診断情報で構成されます。predict 関数を使用してモデルの応答を予測でき、random 関数を使用して新しい設計点に乱数データを生成できます。

構築

fitglme(tbl,formula) を使用して GLME (一般化線形混合効果) モデルを標本データに当てはめることができます。詳細は、fitglme を参照してください。

入力引数

すべて展開する

入力データ。応答変数、予測子変数およびグループ化変数を含みます。テーブルまたはデータセット配列として指定します。予測子変数は、連続変数またはグループ化変数にすることができます (グループ化変数を参照してください)。formula を使用して、変数のモデルを指定しなければなりません。

データ型: table

モデル仕様の式。'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' という形式の文字ベクトルまたは string スカラーを指定します。詳細は、を参照してください。

例: 'y ~ treatment +(1|block)'

プロパティ

すべて展開する

固定効果係数の推定および関連する統計。各係数および以下の列に対し 1 つの行をもつデータセット配列として格納されます。

  • Name — 係数の名前

  • Estimate — 推定される係数値

  • SE — 推定の標準誤差

  • tStat — 係数が 0 であるという検定の t 統計量

  • DF — t 統計量に関連付けられた自由度

  • pValue — t 統計量の p 値

  • Lower — 信頼限界の下限

  • Upper — 信頼限界の上限

ベクトルとしてこれらの列のいずれかを取得するには、ドット表記を使ってプロパティにインデックスを付けます。

coefTest メソッドを使用して係数に他の検定を実行します。

推定固定効果ベクトルの共分散。行列として保存されます。

データ型: single | double

固定効果係数の名前。文字ベクトルの cell 配列として格納されます。定数項の係数のラベルは (Intercept) です。他の係数のラベルは、乗算する項を示します。項にカテゴリカル予測子が含まれる場合、ラベルはその予測子の水準も示します。

データ型: cell

誤差に対する自由度。正の整数値として格納します。DFE は観測値の数から推定係数の数を引いたものです。

DFE には、固定効果係数で仮説検定をするために分母の自由度を計算する 'Residual' メソッドに対応する自由度が含まれます。n が観測値の個数、p が固定効果の係数の個数である場合、DFEn – p に等しくなります。

データ型: double

モデル分散パラメーター。スカラー値として格納されます。分散パラメーターは応答の条件付き分散を定義します。

一般化線形混合効果モデルでは、条件付き平均が μi、分散パラメーターが σ2 である場合、観測値 i に対する応答 yi の条件付き分散は次のようになります。

var(yi|μi,σ2)=σ2wiv(μi),

ここで、wi は i 番目の観測値の重みであり、v は指定された応答の条件付き分布に対する分散関数です。Dispersion プロパティには、指定された GLME モデルに対して推定される σ2 が格納されます。Dispersion の値は応答の指定された条件付き分布により異なります。二項分布およびポアソン分布では、Dispersion の理論値は σ2 = 1.0 に等しくなります。

  • FitMethodMPL または REMPL で、 fitglme'DispersionFlag' 名前と値のペアの引数が true の場合、分散パラメーターはすべての分布データから推定されます。これには二項分布およびポアソン分布が含まれます。

  • FitMethodApproximateLaplace または Laplace の場合、fitglme'DispersionFlag' 名前と値のペアの引数は適用されません。また、分散パラメーターは二項分布およびポアソン分布では 1.0 で固定されます。その他すべての分布については、Dispersion はデータから推定されます。

データ型: double

分散パラメーターが推定されたかを示すフラグ。論理値として格納されます。

  • FitMethodApproximateLaplace または Laplace の場合、分散パラメーターは二項分布およびポアソン分布の場合は 1.0 の理論値で固定され、DispersionEstimatedfalse になります。その他の分布では、分散パラメーターはデータから推定され、DispersionEstimatedtrue になります。

  • FitMethodMPL または REMPL で、かつ fitglme'DispersionFlag' 名前と値のペアの引数が true に指定される場合、分散パラメーターは二項分布およびポアソン分布を含むすべての分布に推定され、DispersionEstimatedtrue になります。

  • FitMethodMPL または REMPL であり、かつ fitglme において 'DispersionFlag' 名前と値のペアの引数が false に指定される場合、分散パラメーターは二項分布およびポアソン分布の理論値で固定され、DispersionEstimatedfalse になります。二項分布およびポアソン分布以外の分布については、分散パラメーターはデータから推定され、DispersionEstimatedtrue になります。

データ型: logical

応答分布名。次のいずれかとして格納されます。

  • 'Normal' — 正規分布

  • 'Binomial' — 二項分布

  • 'Poisson' — ポアソン分布

  • 'Gamma' — ガンマ分布

  • 'InverseGaussian' — 逆ガウス分布

モデルの当てはめに使用するメソッド。以下のいずれかとして格納されます。

  • 'MPL' — 疑似最尤法

  • 'REMPL' — 制限付き疑似最尤法

  • 'ApproximateLaplace' — 固定効果をプロファイルし、近似ラプラス方式を使った最尤法

  • 'Laplace' — ラプラス方式を使った最尤法

モデル仕様の式。オブジェクトとして保存されます。モデル仕様の式はウィルキンソンの表記法を使用し、GLME モデルでの固定効果項、変量効果項およびグループ化変数間の関係を記述します。詳細は、を参照してください。

推定係数値で評価される尤度関数の対数。スカラー値として格納されます。LogLikelihood はモデルの当てはめに使用されるメソッドにより異なります。

  • 'Laplace' または 'ApproximateLaplace' を使用する場合、LogLikelihood は最大化された対数尤度です。

  • 'MPL' を使用する場合、LogLikelihood は疑似尤度の最後の反復からの疑似データが最大化された対数尤度です。

  • 'REMPL' を使用する場合、LogLikelihood は、疑似尤度の最後の反復からの疑似データが最大された制限付き対数尤度です。

データ型: double

近似された一般化線形混合効果モデルを比較するためのモデル基準。以下のフィールドをもつ表として格納されます。

フィールド説明
AIC赤池情報量基準
BICベイズ情報量基準
LogLikelihood
  • 'Laplace' または 'ApproximateLaplace' を使用するモデル近似では、LogLikelihood は最大化された対数尤度です。

  • 'MPL' を使用するモデル近似での LogLikelihood は、疑似尤度の最後の反復からの疑似データが最大化された対数尤度です。

  • 'REMPL' を使用するモデル近似での LogLikelihood は、疑似尤度の最後の反復からの疑似データが最大化された制限付き対数尤度です。

Deviance–2 倍の LogLikelihood

近似された一般化線形混合効果モデルの固定効果係数の数。正の整数値として格納されます。

データ型: double

近似された一般化線形混合効果モデルの推定固定効果係数の数。正の整数値として格納されます。

データ型: double

近似で使用される観測値の数。正の整数値として保存されます。NumObservations はテーブルまたはデータセット配列 tbl の行数から fitglme'Exclude' 名前と値のペアを使用して除外した行、または NaN 値を含む行を差し引いた行数です。

データ型: double

一般化線形混合効果モデルで予測子として使用される変数の数。正の整数値として格納されます。

データ型: double

応答や予測子を含む変数の総数。正の整数値として格納されます。標本データがテーブルまたはデータセット配列 tbl に含まれている場合、NumVariablestbl 内の応答変数に含まれる変数の総数です。NumVariables に変数が含まれる場合、これらは予測子または応答として使用されません。

データ型: double

近似に使用される観測についての情報。テーブルとして格納します。

ObservationInfo には、観測ごとに 1 つの行と以下の列があります。

名前説明
Weights観測値の重みの値。既定値は 1 です。
Excludedfitglme において観測値を近似から除外するために 'Exclude' 名と値のペアの引数を使用する場合、Excludedtrue または 1 です。それ以外の場合は、Excludedfalse または 0 です。
Missing

応答または予測子の値が欠損しているために観測値を近似から除外した場合 、Missingtrue です。それ以外の場合は、Missingfalse です。

欠損値は、数値の場合は NaN、cell 配列の場合は空のセル、文字配列の場合は空行、categorical 配列の場合は <undefined> 値です。

Subset観測値が近似で使用された場合、Subsettrue です。欠損していたか除外されたため観測値が近似で使用されなかった場合、Subsetfalse です。
BinomSize観測値ごとの二項サイズ。この列は二項分布を近似するときのみ適用されます。

データ型: table

当てはめに使用される観測値の名前。文字ベクトルの cell 配列として格納されます。

  • データが観測名を含むテーブルまたはデータセット配列 tbl に含まれている場合、ObservationNames はそれらの名前を使用します。

  • データが行列または観測名を含まないテーブルまたはデータセット配列にある場合、ObservationNames は空の cell 配列です。

データ型: cell

当てはめで予測子として使用される変数の名前。NumPredictors と同じ長さの文字ベクトルの cell 配列として格納されます。

データ型: cell

当てはめで応答変数として使用される変数の名前。文字ベクトルとして格納されます。

データ型: char

近似モデルで説明される応答の変動性の比率。構造体として格納されます。Rsquared は近似モデルの R 二乗値を含み、これは複数の相関係数とも呼ばれます。Rsquared には以下のフィールドがあります。

フィールド説明
Ordinary決定係数値。構造体のスカラー値として格納されます。
Rsquared.Ordinary = 1 — SSE./SST
Adjusted固定効果係数の数を調整した決定係数値。構造体のスカラー値として格納されます。
Rsquared.Adjusted = 1 — (SSE./SST)*(DFT./DFE)
ここで DFE = n – pDFT = n – 1n は観測値の総数であり、p は固定効果係数の数です。

データ型: struct

誤差二乗和。正のスカラーを指定します。SSE は二乗した条件付き残差の重み付き和で、次のように計算します。

SSE=i=1Nwieff(yifi)2,

ここで N は観測値の個数、wieff は i 番目の有効な重み、yi は i 番目の応答、fi は i 番目の近似値です。

i 番目の有効な重みは以下のように計算します。

wieff={wivi(fi(β^,b^))},

ここで、wi は i 番目の観測値の重み、vi は i 番目の観測値の分散項、β^b^ はそれぞれ β と b の推定値です。

i 番目の近似値は次のように計算します。

fi=g1(xiTβ^+ziTb^+δi),

ここで、g はリンク関数、xiT は固定効果の計画行列 X の i 番目の行、ziT は変量効果の計画行列 Z の i 番目の行、δi は i 番目のオフセット値です。

データ型: double

回帰二乗和。正のスカラーを指定します。SSR は一般化線形混合効果回帰で説明される二乗和で、当てはめた値と応答の平均の間における偏差の二乗和に等しい値です。SSR は次のように計算されます。

SSR=i=1Nwieff(fiy¯)2,

ここで、N は観測値の個数、wieff は i 番目の有効な重み、fi は i 番目の近似値、y¯ は応答の加重平均です。

i 番目の有効な重みは以下のように計算します。

wieff={wivi(fi(β^,b^))},

ここで、wi は i 番目の観測値の重み、vi は i 番目の観測値の分散項、β^b^ はそれぞれ β と b の推定値です。

i 番目の近似値は次のように計算します。

fi=g1(xiTβ^+ziTb^+δi),

ここで、g はリンク関数、xiT は固定効果の計画行列 X の i 番目の行、ziT は変量効果の計画行列 Z の i 番目の行、δi は i 番目のオフセット値です。

データ型: double

二乗総和。正のスカラーを指定します。

切片をもつ GLME モデルでは、SST は次のように計算されます。

SST = SSE + SSR,

ここで、SST は二乗総和、SSE は誤差二乗和、SSR は回帰二乗和です。

切片のない GLME モデルでは、SST は次のように計算されます。

SST=i=1Nwieff(yiy¯)2,

ここで、N は観測値の個数、wieff は i 番目の有効な重み、yi は i 番目の応答値、y¯ は応答の加重平均です。

データ型: double

近似で使用される変数の情報。表として保存されます。VariableInfo は変数ごとに 1 つの行をもち、以下の列を含みます。

列名説明
Class変数のクラス ('double''cell''nominal' など)。
Range

変数の値の範囲。

  • 数値変数の場合、Range[min,max] 形式の 2 要素ベクトルです。

  • セルまたはカテゴリカル変数の場合、Range は変数の一意の値をすべて含むセルまたは categorical 配列です。

InModel

変数が近似モデルの予測子である場合、InModeltrue です。

変数が近似モデルに含まれていない場合、InModelfalse です。

IsCategorical

変数の型がカテゴリカル予測子 (セル、論理、カテゴリカルなど) として処理される場合、IsCategoricaltrue です。

変数が連続予測子である場合、IsCategoricalfalse です。

データ型: table

テーブルまたはデータセット配列 tbl に含まれているすべての変数の名前。文字ベクトルの cell 配列として格納されます。

データ型: cell

変数。テーブルとして格納します。近似がテーブルまたはデータセット配列 tbl に基づいている場合、Variablestbl と同じです。

データ型: table

オブジェクト関数

anova一般化線形混合効果モデルの分散分析
coefCI一般化線形混合効果モデルの係数の信頼区間
coefTest一般化線形混合効果モデルの固定効果と変量効果についての仮説検定
compare一般化線形混合効果モデルの比較
covarianceParameters一般化線形混合効果モデルの共分散パラメーターの抽出
designMatrix固定効果と変量効果の計画行列
fitted一般化線形混合効果モデルからの近似応答
fixedEffects固定効果と関連する統計の推定
partialDependence部分依存の計算
plotPartialDependence部分依存プロット (PDP) および個別条件付き期待値 (ICE) プロットの作成
plotResiduals一般化線形混合効果モデルの残差のプロット
predict一般化線形混合効果モデルの応答の予測
random近似された一般化線形混合効果モデルからのランダム応答の生成
randomEffects変量効果と関連する統計の推定
refit 一般化線形混合効果モデルの再当てはめ
residuals近似された一般化線形混合効果モデルの残差
response一般化線形混合効果モデルの応答ベクトル

すべて折りたたむ

標本データを読み込みます。

load mfr

このシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果をテストするため、同社は実験に参加させる 20 工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。

  • 新しいプロセスがバッチに使用されたかどうかを示すフラグ (newprocess)

  • 各バッチの処理時間。時間単位 (time)

  • バッチの温度。摂氏 (temp)

  • バッチで使用する化学薬品の供給業者 (AB または C) を示すカテゴリカル変数 (supplier)

  • バッチ内の欠陥数 (defects)

またデータに含まれる time_devtemp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。

固定効果予測子として newprocesstime_devtemp_dev および supplier を使用して一般化線形混合効果モデルを当てはめます。工場特有の変動に起因して品質に差がある可能性を考慮するために、factory 別にグループ化された切片の変量効果項を含めます。応答変数 defects はポアソン分布であり、このモデルの適切なリンク関数は対数です。係数の予測にラプラス近似メソッドを使用します。ダミー変数エンコードを 'effects' として指定すると、ダミー変数の係数の合計が 0 になります。

欠陥数はポアソン分布を使用してモデル化できます

defectsijPoisson(μij)

これは一般化線形混合効果モデルに対応します

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

ここで

  • defectsij は、バッチ j 処理中の工場 i で実行されたバッチで観測された欠陥数です。

  • μij は、バッチ j (j=1,2,...,5) 処理中の工場 i (i=1,2,...,20) に対応する欠陥の平均数です。

  • newprocessijtime_devij および temp_devij は、バッチ j 処理中の工場 i に対応する各変数の測定値です。たとえば newprocessij は、工場 i で実行されたバッチ j 処理中に新プロセスが使用されたかどうかを示します。

  • supplier_Cij および supplier_Bij はエフェクト (ゼロサム) コーディングを使用するダミー変数であり、バッチ j 処理中に工場 i で実行されたバッチに対して、それぞれ会社 C または B が加工化学薬品を供給したかどうかを示します。

  • biN(0,σb2) は、工場特有の品質変動に相当する、各工場 i の変量効果の切片です。

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

モデルを表示します。

disp(glme)
Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue        Lower        Upper    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15       1.1515       1.7864
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122     -0.72019    -0.015134
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941      -1.7395       1.5505
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907      -2.1926       1.6263
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936     -0.22679     0.083051
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1       

Model information 表は標本データの観測値の合計 (100)、固定効果および変量効果係数の数 (それぞれ 6 および 20)、共分散パラメーターの数 (1) を表示しています。また、応答変数は Poisson 分布であり、リンク関数は Log であり、近似メソッドが Laplace であることもわかります。

Formula はウィルキンソンの表記法によるモデル仕様を示します。

Model fit statistics 表はモデルの適合度の評価に使用された統計を表します。これには赤池情報量基準 (AIC)、ベイズ情報量基準 (BIC) 値、対数尤度 (LogLikelihood) および逸脱度 (Deviance) の値が含まれます。

Fixed effects coefficients 表は、fitglme が 95% の信頼区間を返したことを示します。これには固定効果予測子ごとに 1 行が含まれ、各列にはその予測子に対応する統計が含まれます。列 1 (Name) には各固定効果係数の名前が含まれ、列 2 (Estimate) にはその推定値が含まれ、列 3 (SE) には係数の標準誤差が含まれます。列 4 (tStat) には係数が 0 に等しいという仮説検定のための t 統計量が含まれます。列 5 (DF) と列 6 (pValue) には t 統計量に対応する自由度と p 値がそれぞれ含まれます。最後の 2 列 (Lower および Upper) には、各固定効果係数の 95% 信頼区間の下限と上限がそれぞれ表示されます。

Random effects covariance parameters は各グループ化変数 (ここでは factory のみ) の表を表示します。これには水準の総数 (20)、共分散パラメーターの型および推定値が含まれます。ここでの std は、工場の予測子に関連付けられている変量効果の標準偏差が fitglme から返されることを示します。この推定値は 0.31381 です。また、誤差パラメーターの型 (ここでは分散パラメーターの平方根) およびその推定値 1 を含む表も表示します。

fitglme により生成される標準表示は変量効果パラメーターの信頼区間を指定しません。covarianceParameters を使用して、これらの値を計算し表示します。

詳細

すべて展開する