GeneralizedLinearMixedModel クラス

一般化線形混合効果モデルクラス

説明

GeneralizedLinearMixedModel オブジェクトは、固定効果および変量効果両方を含む応答変数の回帰モデルを表します。このオブジェクトはデータ、モデルの説明、当てはめた係数、共分散パラメーター、計画行列、残差、残差プロットおよび GLME (一般化線形混合効果) モデルのその他の診断情報で構成されます。predict 関数を使用してモデルの応答を予測でき、random 関数を使用して新しい設計点に乱数データを生成できます。

構築

fitglme(tbl,formula) を使用して GLME (一般化線形混合効果) モデルを標本データに当てはめることができます。詳細は、fitglme を参照してください。

入力引数

すべて展開する

`tbl` — 入力データ
table | データセット配列

入力データ。応答変数、予測子変数およびグループ化変数を含みます。テーブルまたはデータセット配列として指定します。予測子変数は、連続変数またはグループ化変数にすることができます (グループ化変数を参照してください)。formula を使用して、変数のモデルを指定しなければなりません。

データ型: table

`formula` — モデル仕様の式
`'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'` という形式の文字ベクトルまたは string スカラー

モデル仕様の式。'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' という形式の文字ベクトルまたは string スカラーを指定します。詳細は、式を参照してください。

例: 'y ~ treatment +(1|block)'

プロパティ

すべて展開する

`Coefficients` — 固定効果係数の推定
データセット配列

固定効果係数の推定および関連する統計。各係数および以下の列に対し 1 つの行をもつデータセット配列として格納されます。

Name — 係数の名前
Estimate — 推定される係数値
SE — 推定の標準誤差
tStat — 係数が 0 であるという検定の t 統計量
DF — t 統計量に関連付けられた自由度
pValue — t 統計量の p 値
Lower — 信頼限界の下限
Upper — 信頼限界の上限

ベクトルとしてこれらの列のいずれかを取得するには、ドット表記を使ってプロパティにインデックスを付けます。

coefTest メソッドを使用して係数に他の検定を実行します。

`CoefficientCovariance` — 推定固定効果係数の共分散
行列

推定固定効果係数の共分散。行列として格納されます。

データ型: single | double

`CoefficientNames` — 固定効果係数の名前
文字ベクトルの cell 配列

固定効果係数の名前。文字ベクトルの cell 配列として格納されます。定数項の係数のラベルは (Intercept) です。他の係数のラベルは、乗算する項を示します。項にカテゴリカル予測子が含まれる場合、ラベルはその予測子の水準も示します。

データ型: cell

`DFE` — 誤差に対する自由度
正の整数値

誤差に対する自由度。正の整数値として格納します。DFE は観測値の数から推定係数の数を引いたものです。

DFE には、固定効果係数で仮説検定をするために分母の自由度を計算する 'Residual' メソッドに対応する自由度が含まれます。n が観測値の個数、p が固定効果の係数の個数である場合、DFE は n – p に等しくなります。

データ型: double

`Dispersion` — モデル分散パラメーター
スカラー値

モデル分散パラメーター。スカラー値として格納されます。分散パラメーターは応答の条件付き分散を定義します。

一般化線形混合効果モデルでは、条件付き平均が μ_i、分散パラメーターが σ² である場合、観測値 i に対する応答 y_i の条件付き分散は次のようになります。

$var (y_{i} | μ_{i}, σ^{2}) = \frac{σ^{2}}{w_{i}} v (μ_{i}),$

ここで、w_i は i 番目の観測値の重みであり、v は指定された応答の条件付き分布に対する分散関数です。Dispersion プロパティには、指定された GLME モデルに対して推定される σ² が格納されます。Dispersion の値は応答の指定された条件付き分布により異なります。二項分布およびポアソン分布では、Dispersion の理論値は σ² = 1.0 に等しくなります。

FitMethod が MPL または REMPL で、 fitglme の 'DispersionFlag' 名前と値のペアの引数が true の場合、分散パラメーターはすべての分布データから推定されます。これには二項分布およびポアソン分布が含まれます。
FitMethod が ApproximateLaplace または Laplace の場合、fitglme の 'DispersionFlag' 名前と値のペアの引数は適用されません。また、分散パラメーターは二項分布およびポアソン分布では 1.0 で固定されます。その他すべての分布については、Dispersion はデータから推定されます。

データ型: double

`DispersionEstimated` — 分散パラメーターが推定されたかを示すフラグ
`true` | `false`

分散パラメーターが推定されたかを示すフラグ。論理値として格納されます。

FitMethod が ApproximateLaplace または Laplace の場合、分散パラメーターは二項分布およびポアソン分布の場合は 1.0 の理論値で固定され、DispersionEstimated は false になります。その他の分布では、分散パラメーターはデータから推定され、DispersionEstimated は true になります。
FitMethod が MPL または REMPL で、かつ fitglme の 'DispersionFlag' 名前と値のペアの引数が true に指定される場合、分散パラメーターは二項分布およびポアソン分布を含むすべての分布に推定され、DispersionEstimated は true になります。
FitMethod が MPL または REMPL であり、かつ fitglme において 'DispersionFlag' 名前と値のペアの引数が false に指定される場合、分散パラメーターは二項分布およびポアソン分布の理論値で固定され、DispersionEstimated は false になります。二項分布およびポアソン分布以外の分布については、分散パラメーターはデータから推定され、DispersionEstimated は true になります。

データ型: logical

`Distribution` — 応答分布名
`'Normal'` | `'Binomial'` | `'Poisson'` | `'Gamma'` | `'InverseGaussian'`

応答分布名。次のいずれかとして格納されます。

'Normal' — 正規分布
'Binomial' — 二項分布
'Poisson' — ポアソン分布
'Gamma' — ガンマ分布
'InverseGaussian' — 逆ガウス分布

`FitMethod` — モデルの当てはめに使用するメソッド
`'MPL'` | `'REMPL'` | `'ApproximateLaplace'` | `'Laplace'`

モデルの当てはめに使用するメソッド。以下のいずれかとして格納されます。

'MPL' — 疑似最尤法
'REMPL' — 制限付き疑似最尤法
'ApproximateLaplace' — 固定効果をプロファイルし、近似ラプラス方式を使った最尤法
'Laplace' — ラプラス方式を使った最尤法

`Formula` — モデル仕様の式
オブジェクト

モデル仕様の式。オブジェクトとして保存されます。モデル仕様の式はウィルキンソンの表記法を使用し、GLME モデルでの固定効果項、変量効果項およびグループ化変数間の関係を記述します。詳細は、式を参照してください。

`Link` — リンク関数の特性
構造体

リンク関数の特性。以下のフィールドを含む構造体として格納されます。リンクは関数 G です。分布パラメーター MU は、次のように線形予測子 ETA にリンクされます。G(MU) = ETA。

フィールド	説明
`Name`	リンク関数の名前
`Link`	`G` を定義する関数
`Derivative`	`G` の導関数
`SecondDerivative`	`G` の 2 次導関数
`Inverse`	`G` の逆関数

データ型: struct

`LogLikelihood` — 尤度関数の対数
スカラー値

推定係数値で評価される尤度関数の対数。スカラー値として格納されます。LogLikelihood はモデルの当てはめに使用されるメソッドにより異なります。

'Laplace' または 'ApproximateLaplace' を使用する場合、LogLikelihood は最大化された対数尤度です。
'MPL' を使用する場合、LogLikelihood は疑似尤度の最後の反復からの疑似データが最大化された対数尤度です。
'REMPL' を使用する場合、LogLikelihood は、疑似尤度の最後の反復からの疑似データが最大された制限付き対数尤度です。

データ型: double

`ModelCriterion` — モデル基準
table

当てはめた一般化線形混合効果モデルを比較するためのモデル基準。以下のフィールドをもつ表として格納されます。

フィールド	説明
`AIC`	赤池情報量基準
`BIC`	ベイズ情報量基準
`LogLikelihood`	`'Laplace'` または `'ApproximateLaplace'` を使用するモデル近似では、`LogLikelihood` は最大化された対数尤度です。 `'MPL'` を使用するモデル近似での `LogLikelihood` は、疑似尤度の最後の反復からの疑似データが最大化された対数尤度です。 `'REMPL'` を使用するモデル近似での `LogLikelihood` は、疑似尤度の最後の反復からの疑似データが最大化された制限付き対数尤度です。
`Deviance`	–2 倍の `LogLikelihood`

`NumCoefficients` — 固定効果係数の数
正の整数値

当てはめた一般化線形混合効果モデルの固定効果係数の数。正の整数値として格納されます。

データ型: double

`NumEstimatedCoefficients` — 推定固定効果係数の数
正の整数値

当てはめた一般化線形混合効果モデルの推定固定効果係数の数。正の整数値として格納されます。

データ型: double

`NumObservations` — 観測値の数
正の整数値

近似で使用される観測値の数。正の整数値として保存されます。NumObservations はテーブルまたはデータセット配列 tbl の行数から fitglme の 'Exclude' 名前と値のペアを使用して除外した行、または NaN 値を含む行を差し引いた行数です。

データ型: double

`NumPredictors` — 予測子の数
正の整数値

一般化線形混合効果モデルで予測子として使用される変数の数。正の整数値として格納されます。

データ型: double

`NumVariables` — 変数の総数
正の整数値

応答や予測子を含む変数の総数。正の整数値として格納されます。標本データがテーブルまたはデータセット配列 tbl に含まれている場合、NumVariables は tbl 内の応答変数に含まれる変数の総数です。NumVariables に変数が含まれる場合、これらは予測子または応答として使用されません。

データ型: double

`ObservationInfo` — 観測についての情報
table

近似に使用される観測についての情報。table として格納します。

ObservationInfo には、観測ごとに 1 つの行と以下の列があります。

名前	説明
`Weights`	観測値の重みの値。既定値は 1 です。
`Excluded`	`fitglme` において観測値を近似から除外するために `'Exclude'` 名と値のペアの引数を使用する場合、`Excluded` は `true` または `1` です。それ以外の場合は、`Excluded`は `false` または `0` です。
`Missing`	応答または予測子の値が欠損しているために観測値を近似から除外した場合、`Missing` は `true` です。それ以外の場合は、`Missing` は `false` です。欠損値は、数値の場合は `NaN`、cell 配列の場合は空のセル、文字配列の場合は空行、categorical 配列の場合は `<undefined>` 値です。
`Subset`	観測値が近似で使用された場合、`Subset` は `true` です。欠損していたか除外されたため観測値が近似で使用されなかった場合、`Subset` は `false` です。
`BinomSize`	観測値ごとの二項サイズ。この列は二項分布を当てはめるときのみ適用されます。

データ型: table

`ObservationNames` — 観測の名前
文字ベクトルの cell 配列

当てはめに使用される観測値の名前。文字ベクトルの cell 配列として格納されます。

データが観測名を含むテーブルまたはデータセット配列 tbl に含まれている場合、ObservationNames はそれらの名前を使用します。
データが行列または観測名を含まないテーブルまたはデータセット配列にある場合、ObservationNames は空の cell 配列です。

データ型: cell

`PredictorNames` — 予測子の名前
文字ベクトルの cell 配列

当てはめで予測子として使用される変数の名前。NumPredictors と同じ長さの文字ベクトルの cell 配列として格納されます。

データ型: cell

`ResponseName` — 応答変数の名前
文字ベクトル

当てはめで応答変数として使用される変数の名前。文字ベクトルとして格納されます。

データ型: char

`Rsquared` — 当てはめたモデルで説明される応答の変動性の比率
構造体

当てはめたデルで説明される応答の変動性の比率。構造体として格納されます。Rsquared は当てはめたモデルの R 二乗値を含み、これは複数の相関係数とも呼ばれます。Rsquared には以下のフィールドがあります。

フィールド	説明
`Ordinary`	決定係数値。構造体のスカラー値として格納されます。 `Rsquared.Ordinary = 1 — SSE./SST`
`Adjusted`	固定効果係数の数を調整した決定係数値。構造体のスカラー値として格納されます。 `Rsquared.Adjusted = 1 — (SSE./SST)*(DFT./DFE)`、ここで `DFE = n – p`、`DFT = n – 1`、`n` は観測値の総数であり、`p` は固定効果係数の数です。

データ型: struct

`SSE` — 誤差の二乗和
正のスカラー

誤差の二乗和。正のスカラーとして指定します。SSE は二乗した条件付き残差の重み付き和で、次のように計算します。

$S S E = \sum_{i = 1}^{N} w_{i}^{e f f} {(y_{i} - f_{i})}^{2},$

ここで N は観測値の個数、w_i^eff は i 番目の有効な重み、y_i は i 番目の応答、f_i は i 番目の当てはめた値です。

i 番目の有効な重みは以下のように計算します。

$w_{i}^{e f f} = {\frac{w_{i}}{v_{i} (f_{i} (\hat{β}, \hat{b}))}},$

ここで、w_i は i 番目の観測値の重み、v_i は i 番目の観測値の分散項、 $\hat{β}$ と $\hat{b}$ はそれぞれ β と b の推定値です。

i 番目の当てはめた値は次のように計算します。

$f_{i} = g^{- 1} (x_{i}^{T} \hat{β} + z_{i}^{T} \hat{b} + δ_{i}),$

ここで、g はリンク関数、x_i^T は固定効果の計画行列 X の i 番目の行、z_i^T は変量効果の計画行列 Z の i 番目の行、δ_i は i 番目のオフセット値です。

データ型: double

`SSR` — 回帰二乗和
正のスカラー

回帰二乗和。正のスカラーを指定します。SSR は一般化線形混合効果回帰で説明される二乗和で、当てはめた値と応答の平均の間における偏差の二乗和に等しい値です。SSR は次のように計算されます。

$S S R = \sum_{i = 1}^{N} w_{i}^{e f f} {(f_{i} - \bar{y})}^{2},$

ここで、N は観測値の個数、w_i^eff は i 番目の有効な重み、f_i は i 番目の当てはめた値、 $\bar{y}$ は応答の加重平均です。

i 番目の有効な重みは以下のように計算します。

$w_{i}^{e f f} = {\frac{w_{i}}{v_{i} (f_{i} (\hat{β}, \hat{b}))}},$

ここで、w_i は i 番目の観測値の重み、v_i は i 番目の観測値の分散項、 $\hat{β}$ と $\hat{b}$ はそれぞれ β と b の推定値です。

i 番目の当てはめた値は次のように計算します。

$f_{i} = g^{- 1} (x_{i}^{T} \hat{β} + z_{i}^{T} \hat{b} + δ_{i}),$

データ型: double

`SST` — 二乗の総和
正のスカラー

二乗総和。正のスカラーを指定します。

切片をもつ GLME モデルでは、SST は次のように計算されます。

SST = SSE + SSR,

ここで、SST は二乗総和、SSE は誤差二乗和、SSR は回帰二乗和です。

切片のない GLME モデルでは、SST は次のように計算されます。

$S S T = \sum_{i = 1}^{N} w_{i}^{e f f} {(y_{i} - \bar{y})}^{2},$

ここで、N は観測値の個数、w_i^eff は i 番目の有効な重み、y_i は i 番目の応答値、 $\bar{y}$ は応答の加重平均です。

データ型: double

`VariableInfo` — 変数の情報
table

近似で使用される変数の情報。表として保存されます。VariableInfo は変数ごとに 1 つの行をもち、以下の列を含みます。

列名	説明
`Class`	変数のクラス (`'double'`、`'cell'`、`'nominal'` など)。
`Range`	変数の値の範囲。数値変数の場合、`Range` は `[min,max]` 形式の 2 要素ベクトルです。セルまたはカテゴリカル変数の場合、`Range` は変数の一意の値をすべて含むセルまたは categorical 配列です。
`InModel`	変数が当てはめたモデルの予測子である場合、`InModel` は `true` です。変数が当てはめたモデルに含まれていない場合、`InModel` は `false` です。
`IsCategorical`	変数の型がカテゴリカル予測子 (セル、論理、カテゴリカルなど) として処理される場合、`IsCategorical` は `true` です。変数が連続予測子である場合、`IsCategorical` は `false` です。

データ型: table

`VariableNames` — 変数の名前
文字ベクトルの cell 配列

テーブルまたはデータセット配列 tbl に含まれているすべての変数の名前。文字ベクトルの cell 配列として格納されます。

データ型: cell

`Variables` — 変数
table

変数。table として格納します。近似が table またはデータセット配列 tbl に基づいている場合、Variables は tbl と同じです。

データ型: table

オブジェクト関数

`anova`	一般化線形混合効果モデルの分散分析
`coefCI`	一般化線形混合効果モデルの係数の信頼区間
`coefTest`	一般化線形混合効果モデルの固定効果と変量効果についての仮説検定
`compare`	一般化線形混合効果モデルの比較
`covarianceParameters`	一般化線形混合効果モデルの共分散パラメーターの抽出
`designMatrix`	固定効果と変量効果の計画行列
`fitted`	一般化線形混合効果モデルからの当てはめた応答
`fixedEffects`	固定効果と関連する統計の推定
`partialDependence`	部分依存の計算
`plotPartialDependence`	部分依存プロット (PDP) および個別条件付き期待値 (ICE) プロットの作成
`plotResiduals`	一般化線形混合効果モデルの残差のプロット
`predict`	一般化線形混合効果モデルの応答の予測
`random`	当てはめた一般化線形混合効果モデルからのランダム応答の生成
`randomEffects`	変量効果と関連する統計の推定
`refit`	一般化線形混合効果モデルの再当てはめ
`residuals`	当てはめた一般化線形混合効果モデルの残差
`response`	一般化線形混合効果モデルの応答ベクトル

例

すべて折りたたむ

一般化線形混合効果モデルの当てはめ

ライブスクリプトを開く

標本データを読み込みます。

load mfr

このシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果をテストするため、同社は実験に参加させる 20 工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。

新しいプロセスがバッチに使用されたかどうかを示すフラグ (newprocess)
各バッチの処理時間。時間単位 (time)
バッチの温度。摂氏 (temp)
バッチで使用する化学薬品の供給業者 (A、B または C) を示すカテゴリカル変数 (supplier)
バッチ内の欠陥数 (defects)

またデータに含まれる time_dev と temp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。

固定効果予測子として newprocess、time_dev、temp_dev および supplier を使用して一般化線形混合効果モデルを当てはめます。工場特有の変動に起因して品質に差がある可能性を考慮するために、factory 別にグループ化された切片の変量効果項を含めます。応答変数 defects はポアソン分布であり、このモデルの適切なリンク関数は対数です。係数の予測にラプラス近似メソッドを使用します。ダミー変数エンコードを 'effects' として指定すると、ダミー変数の係数の合計が 0 になります。

欠陥数はポアソン分布を使用してモデル化できます

${defects}_{i j} \sim Poisson (μ_{i j})$

これは一般化線形混合効果モデルに対応します

$\log (μ_{i j}) = β_{0} + β_{1} {newprocess}_{i j} + β_{2} {time_dev}_{i j} + β_{3} {temp_dev}_{i j} + β_{4} {supplier_C}_{i j} + β_{5} {supplier_B}_{i j} + b_{i},$

ここで

${defects}_{i j}$ は、バッチ $j$ 処理中の工場 $i$ で実行されたバッチで観測された欠陥数です。
$μ_{i j}$ は、バッチ $j$ ( $j = 1, 2, . . ., 5$ ) 処理中の工場 $i$ ( $i = 1, 2, . . ., 20$ ) に対応する欠陥の平均数です。
${newprocess}_{i j}$ 、 ${time_dev}_{i j}$ および ${temp_dev}_{i j}$ は、バッチ $j$ 処理中の工場 $i$ に対応する各変数の測定値です。たとえば ${newprocess}_{i j}$ は、工場 $i$ で実行されたバッチ $j$ 処理中に新プロセスが使用されたかどうかを示します。
${supplier_C}_{i j}$ および ${supplier_B}_{i j}$ はエフェクト (ゼロサム) コーディングを使用するダミー変数であり、バッチ $j$ 処理中に工場 $i$ で実行されたバッチに対して、それぞれ会社 C または B が加工化学薬品を供給したかどうかを示します。
$b_{i} \sim N (0, σ_{b}^{2})$ は、工場特有の品質変動に相当する、各工場 $i$ の変量効果の切片です。

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

モデルを表示します。

disp(glme)

Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue        Lower        Upper    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15       1.1515       1.7864
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122     -0.72019    -0.015134
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941      -1.7395       1.5505
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907      -2.1926       1.6263
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936     -0.22679     0.083051
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1

Model information 表は標本データの観測値の合計 (100)、固定効果および変量効果係数の数 (それぞれ 6 および 20)、共分散パラメーターの数 (1) を表示しています。また、応答変数は Poisson 分布であり、リンク関数は Log であり、近似メソッドが Laplace であることもわかります。

Formula はウィルキンソンの表記法によるモデル仕様を示します。

Model fit statistics 表はモデルの適合度の評価に使用された統計を表します。これには赤池情報量基準 (AIC)、ベイズ情報量基準 (BIC) 値、対数尤度 (LogLikelihood) および逸脱度 (Deviance) の値が含まれます。

Fixed effects coefficients 表は、fitglme が 95% の信頼区間を返したことを示します。これには固定効果予測子ごとに 1 行が含まれ、各列にはその予測子に対応する統計が含まれます。列 1 (Name) には各固定効果係数の名前が含まれ、列 2 (Estimate) にはその推定値が含まれ、列 3 (SE) には係数の標準誤差が含まれます。列 4 (tStat) には係数が 0 に等しいという仮説検定のための $t$ 統計量が含まれます。列 5 (DF) と列 6 (pValue) には $t$ 統計量に対応する自由度と $p$ 値がそれぞれ含まれます。最後の 2 列 (Lower および Upper) には、各固定効果係数の 95% 信頼区間の下限と上限がそれぞれ表示されます。

Random effects covariance parameters は各グループ化変数 (ここでは factory のみ) の表を表示します。これには水準の総数 (20)、共分散パラメーターのタイプおよび推定値が含まれます。ここでの std は、工場の予測子に関連付けられている変量効果の標準偏差が fitglme から返されることを示します。この推定値は 0.31381 です。また、誤差パラメーターのタイプ (ここでは分散パラメーターの平方根) およびその推定値 1 を含む表も表示します。

fitglme により生成される標準表示は変量効果パラメーターの信頼区間を指定しません。covarianceParameters を使用して、これらの値を計算し表示します。

バイナリデータへの一般化混合効果モデルの当てはめ

ライブスクリプトを開く

標本データセット carbig を読み込みます。

load carbig

変数 Acceleration、Model_Year、および Cylinders には、自動車の加速度、製造年、およびエンジンの気筒数のデータがそれぞれ格納されています。このデータは、1970 年から 1982 年までに製造された自動車から収集したものです。

自動車の気筒が 4 気筒よりも多いかどうかを示す CylinderCats という名前の変数を作成します。関数tableを使用して、Acceleration、Model_Year、および CylinderCats のデータから table を作成します。

CylinderCats = Cylinders>4;
tbl = table(Acceleration,Model_Year,CylinderCats);

CylinderCats を応答変数、Model_Year を変量効果として使用して、一般化混合効果モデルをデータに当てはめます。応答データの分布を二項として指定します。

glme = fitglme(tbl,"CylinderCats~Acceleration+(Acceleration|Model_Year)",Distribution="Binomial");

glme は、当てはめ後のモデルに関する情報を含む GeneralizedLinearMixedModel オブジェクトです。

オブジェクト関数fixedEffectsを使用して、既定の信頼水準 95% で固定効果 Acceleration の統計量を調べます。

[~,~,statsFixed] = fixedEffects(glme)

statsFixed = 
    Fixed effect coefficients: DFMethod = 'residual', Alpha = 0.05

    Name                    Estimate    SE          tStat      DF     pValue        Lower       Upper  
    {'(Intercept)' }          4.3838      1.2374     3.5428    404    0.00044213      1.9513     6.8163
    {'Acceleration'}        -0.29673    0.077896    -3.8093    404    0.00016104    -0.44986    -0.1436

Acceleration 項の "p" 値が小さく、自動車の加速度は自動車が 4 気筒よりも多気筒であるかどうかに統計的に有意な影響を与えることを示しています。

オブジェクト関数randomEffectsを使用して、既定の信頼水準 95% で変量効果 Model_Year の統計量を調べます。

[~,~,statsRandom] = randomEffects(glme)

statsRandom = 
    Random effect coefficients: DFMethod = 'residual', Alpha = 0.05

    Group                 Level         Name                    Estimate    SEPred     tStat       DF     pValue      Lower        Upper   
    {'Model_Year'}        {'70'}        {'(Intercept)' }           3.041     2.1322      1.4262    404     0.15457      -1.1506      7.2326
    {'Model_Year'}        {'70'}        {'Acceleration'}        -0.16836    0.13906     -1.2107    404     0.22672     -0.44173     0.10501
    {'Model_Year'}        {'71'}        {'(Intercept)' }          3.4715     2.3452      1.4802    404     0.13959      -1.1389      8.0818
    {'Model_Year'}        {'71'}        {'Acceleration'}        -0.21721    0.15106     -1.4378    404     0.15125     -0.51418    0.079764
    {'Model_Year'}        {'72'}        {'(Intercept)' }          4.2634     2.4382      1.7486    404    0.081124     -0.52977      9.0566
    {'Model_Year'}        {'72'}        {'Acceleration'}        -0.28827    0.15892     -1.8139    404    0.070435      -0.6007    0.024149
    {'Model_Year'}        {'73'}        {'(Intercept)' }          3.7951     2.1976      1.7269    404    0.084949     -0.52512      8.1153
    {'Model_Year'}        {'73'}        {'Acceleration'}        -0.21079    0.14182     -1.4864    404     0.13796     -0.48958    0.067996
    {'Model_Year'}        {'74'}        {'(Intercept)' }        -0.77693     2.6678    -0.29123    404     0.77103      -6.0214      4.4675
    {'Model_Year'}        {'74'}        {'Acceleration'}        0.056863    0.16571     0.34314    404     0.73167      -0.2689     0.38263
    {'Model_Year'}        {'75'}        {'(Intercept)' }         -3.2681     2.1531     -1.5178    404     0.12984      -7.5008     0.96463
    {'Model_Year'}        {'75'}        {'Acceleration'}         0.24151    0.13346      1.8096    404    0.071093    -0.020847     0.50387
    {'Model_Year'}        {'76'}        {'(Intercept)' }        -0.28228     2.0922    -0.13492    404     0.89274      -4.3952      3.8306
    {'Model_Year'}        {'76'}        {'Acceleration'}        0.045966    0.13069     0.35171    404     0.72524     -0.21096     0.30289
    {'Model_Year'}        {'77'}        {'(Intercept)' }        -0.78239     2.2806    -0.34305    404     0.73174      -5.2658       3.701
    {'Model_Year'}        {'77'}        {'Acceleration'}        0.052519    0.14498     0.36226    404     0.71735     -0.23249     0.33752
    {'Model_Year'}        {'78'}        {'(Intercept)' }        -0.46307     2.2693    -0.20406    404     0.83841      -4.9242      3.9981
    {'Model_Year'}        {'78'}        {'Acceleration'}        0.050014    0.14243     0.35114    404     0.72567     -0.22999     0.33002
    {'Model_Year'}        {'79'}        {'(Intercept)' }         -2.5181     2.0134     -1.2507    404     0.21178      -6.4762        1.44
    {'Model_Year'}        {'79'}        {'Acceleration'}         0.19051     0.1257      1.5156    404      0.1304    -0.056591     0.43761
    {'Model_Year'}        {'80'}        {'(Intercept)' }         -2.6168     2.4053     -1.0879    404     0.27728      -7.3452      2.1117
    {'Model_Year'}        {'80'}        {'Acceleration'}         0.10117    0.14903     0.67883    404     0.49763     -0.19181     0.39414
    {'Model_Year'}        {'81'}        {'(Intercept)' }         -1.8396     2.4268    -0.75801    404     0.44888      -6.6103      2.9312
    {'Model_Year'}        {'81'}        {'Acceleration'}         0.08723    0.15145     0.57596    404     0.56497      -0.2105     0.38496
    {'Model_Year'}        {'82'}        {'(Intercept)' }         -2.0238     2.5531    -0.79267    404     0.42843      -7.0428      2.9953
    {'Model_Year'}        {'82'}        {'Acceleration'}        0.058853    0.15948     0.36903    404      0.7123     -0.25467     0.37237

table 出力の "p" 値が大きく、いずれの変量効果項も自動車が 4 気筒よりも多気筒であるかどうかに統計的に有意な影響を与えると結論付けるだけの十分な証拠はないことを示しています。

詳細

すべて展開する

式

一般に、モデル仕様の式は 'y ~ terms' という形式の文字ベクトルまたは string スカラーです。一般化線形混合効果モデルでは、この式は 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' の形式になります。ここで、fixed および random には固定効果および変量効果の項がそれぞれ含まれます。R はモデルのグループ化変数の数です。

テーブル tbl に以下のものが格納されていると仮定します。

応答変数 y
連続変数またはグループ化変数である予測子変数 X_j
グループ化変数 g₁、g₂、...、g_R

ここで、X_j および g_r のグループ化変数は、categorical 配列、logical 配列、文字配列、string 配列、または文字ベクトルの cell 配列が可能です。

この場合、'y ~ fixed + (random₁|g₁) + ... + (random_R|g_R)' の形式の式において、項 fixed は固定効果の計画行列 X の仕様に対応し、random₁ はグループ化変数 g₁ に対応する変量効果の計画行列 Z₁ の仕様であり、同様に random_R はグループ化変数 g_R に対応する変量効果の計画行列 Z_R の仕様です。fixed 項および random 項はウィルキンソンの表記法で表現できます。

ウィルキンソンの表記法は、モデルに存在する因子を記述します。この表記法は、モデルに存在する因子に関係するものであり、それらの因子の乗数 (係数) に関係するものではありません。

ウィルキンソンの表記法	標準表記の因子
`1`	定数 (切片) 項
`X^k`、`k` は正の整数	`X`, `X²`, ..., `X^k`
`X1 + X2`	`X1`, `X2`
`X1*X2`	`X1`, `X2`, `X1.*X2 (elementwise multiplication of X1 and X2)`
`X1:X2`	`X1.*X2` のみ
`- X2`	`X2` は含めない
`X1*X2 + X3`	`X1`, `X2`, `X3`, `X1*X2`
`X1 + X2 + X3 + X1:X2`	`X1`, `X2`, `X3`, `X1*X2`
`X1X2X3 - X1:X2:X3`	`X1`, `X2`, `X3`, `X1X2`, `X1X3`, `X2*X3`
`X1*(X2 + X3)`	`X1`, `X2`, `X3`, `X1X2`, `X1X3`

Statistics and Machine Learning Toolbox™ 表記は、-1 を使用して項を明示的に削除しない限り、常に定数項を含みます。線形混合効果モデルの仕様例を次にいくつか挙げます。

次に例を示します。

式	説明
`'y ~ X1 + X2'`	切片の固定効果: `X1` および `X2`。これは、`'y ~ 1 + X1 + X2'` と等価です。
`'y ~ -1 + X1 + X2'`	切片のない `X1` と `X2` の固定効果。`-1` を含めることによって暗黙的な切片の項は抑制されます。
`'y ~ 1 + (1 \| g1)'`	グループ化変数 `g1` の水準ごとの切片の固定効果と切片の変量効果の和。
`'y ~ X1 + (1 \| g1)'`	固定傾きのランダム切片モデル。
`'y ~ X1 + (X1 \| g1)'`	相関があり得るランダムな切片と傾き。これは、`'y ~ 1 + X1 + (1 + X1\|g1)'` と等価です。
`'y ~ X1 + (1 \| g1) + (-1 + X1 \| g1)'`	切片と傾きの独立した変量効果項。
`'y ~ 1 + (1 \| g1) + (1 \| g2) + (1 \| g1:g2)'`	`g1` と `g2` に対する独立したメイン効果のあるランダムな切片モデル + 独立した交互作用効果。

参考

fitglme

GeneralizedLinearMixedModel クラス

説明

構築

入力引数

tbl — 入力データ table | データセット配列

formula — モデル仕様の式 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' という形式の文字ベクトルまたは string スカラー

プロパティ

Coefficients — 固定効果係数の推定 データセット配列

CoefficientCovariance — 推定固定効果係数の共分散 行列

CoefficientNames — 固定効果係数の名前 文字ベクトルの cell 配列

DFE — 誤差に対する自由度 正の整数値

Dispersion — モデル分散パラメーター スカラー値

DispersionEstimated — 分散パラメーターが推定されたかを示すフラグ true | false

Distribution — 応答分布名 'Normal' | 'Binomial' | 'Poisson' | 'Gamma' | 'InverseGaussian'

FitMethod — モデルの当てはめに使用するメソッド 'MPL' | 'REMPL' | 'ApproximateLaplace' | 'Laplace'

Formula — モデル仕様の式 オブジェクト

Link — リンク関数の特性 構造体

LogLikelihood — 尤度関数の対数 スカラー値

ModelCriterion — モデル基準 table

NumCoefficients — 固定効果係数の数 正の整数値

NumEstimatedCoefficients — 推定固定効果係数の数 正の整数値

NumObservations — 観測値の数 正の整数値

NumPredictors — 予測子の数 正の整数値

NumVariables — 変数の総数 正の整数値

ObservationInfo — 観測についての情報 table

ObservationNames — 観測の名前 文字ベクトルの cell 配列

PredictorNames — 予測子の名前 文字ベクトルの cell 配列

ResponseName — 応答変数の名前 文字ベクトル

Rsquared — 当てはめたモデルで説明される応答の変動性の比率 構造体

SSE — 誤差の二乗和 正のスカラー

SSR — 回帰二乗和 正のスカラー

SST — 二乗の総和 正のスカラー

VariableInfo — 変数の情報 table

VariableNames — 変数の名前 文字ベクトルの cell 配列

Variables — 変数 table

オブジェクト関数

例

一般化線形混合効果モデルの当てはめ

バイナリ データへの一般化混合効果モデルの当てはめ

詳細

式

参考

トピック

`tbl` — 入力データ
table | データセット配列

`formula` — モデル仕様の式
`'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'` という形式の文字ベクトルまたは string スカラー

`Coefficients` — 固定効果係数の推定
データセット配列

`CoefficientCovariance` — 推定固定効果係数の共分散
行列

`CoefficientNames` — 固定効果係数の名前
文字ベクトルの cell 配列

`DFE` — 誤差に対する自由度
正の整数値

`Dispersion` — モデル分散パラメーター
スカラー値

`DispersionEstimated` — 分散パラメーターが推定されたかを示すフラグ
`true` | `false`

`Distribution` — 応答分布名
`'Normal'` | `'Binomial'` | `'Poisson'` | `'Gamma'` | `'InverseGaussian'`

`FitMethod` — モデルの当てはめに使用するメソッド
`'MPL'` | `'REMPL'` | `'ApproximateLaplace'` | `'Laplace'`

`Formula` — モデル仕様の式
オブジェクト

`Link` — リンク関数の特性
構造体

`LogLikelihood` — 尤度関数の対数
スカラー値

`ModelCriterion` — モデル基準
table

`NumCoefficients` — 固定効果係数の数
正の整数値

`NumEstimatedCoefficients` — 推定固定効果係数の数
正の整数値

`NumObservations` — 観測値の数
正の整数値

`NumPredictors` — 予測子の数
正の整数値

`NumVariables` — 変数の総数
正の整数値

`ObservationInfo` — 観測についての情報
table

`ObservationNames` — 観測の名前
文字ベクトルの cell 配列

`PredictorNames` — 予測子の名前
文字ベクトルの cell 配列

`ResponseName` — 応答変数の名前
文字ベクトル

`Rsquared` — 当てはめたモデルで説明される応答の変動性の比率
構造体

`SSE` — 誤差の二乗和
正のスカラー

`SSR` — 回帰二乗和
正のスカラー

`SST` — 二乗の総和
正のスカラー

`VariableInfo` — 変数の情報
table

`VariableNames` — 変数の名前
文字ベクトルの cell 配列

`Variables` — 変数
table

バイナリデータへの一般化混合効果モデルの当てはめ