ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

LinearMixedModel クラス

線形混合効果モデル クラス

説明

LinearMixedModel オブジェクトは、固定効果と変量効果をもつ応答変数を表します。このオブジェクトは、モデルの説明、近似係数、共分散パラメーター、計画行列、残差、残差プロットおよび線形混合効果モデル クラスのその他の診断情報で構成されます。predict 関数を使用してモデルの応答を予測でき、random 関数を使用して新しい設計点に乱数データを生成できます。

構築

データがテーブルまたはデータセット配列に格納されている場合は、fitlme(tbl,formula) を使用して線形混合効果モデルを近似できます。または、式を使用したモデルの記述が困難な場合は、固定効果と変量効果を定義する行列を作成し、fitlmematrix(X,y,Z,G) を使用してモデルを近似できます。

入力引数

すべて展開する

入力データ。テーブルまたは配列 dataset として指定された、応答変数、予測子変数およびグループ化変数を含みます。予測子変数は、連続変数またはグループ化変数にすることができます (グループ化変数を参照してください)。formula を使用して、変数のモデルを指定しなければなりません。

データ型: single | double | char | cell

モデル仕様の式。'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' の形式の文字列として指定します。詳細は、を参照してください。

例: 'y ~ treatment +(1|block)'

n 行 p 列の行列として指定される固定効果の計画行列。ここで、n は観測値の数、p は固定効果の予測子変数の数です。X の各行は 1 つの観測値に対応し、X の各列は 1 つの変数に対応します。

データ型: single | double

n 行 1 列のベクトルとして指定された応答値。ここで、n は観測値の数です。

データ型: single | double

変量効果の計画。以下のいずれかとして指定します。

  • モデルに 1 個の変量効果項がある場合、Z は n 行 q 列の行列でなければなりません。n は観測値の数、q は変量効果項の変数の数です。

  • R 個の変量効果項がある場合、Z は長さ R のセル配列でなければなりません。Z の各セルには、各変量効果項に対応する、n 行 q (r) 列の計画行列 Z{r}、r = 1, 2, ..., R が含まれています。ここで、q (r) は、r 番目の変量効果の計画行列 Z{r} の変量効果項の数です。

データ型: single | double | cell

グループ化変数。次のいずれかとして指定します。

  • 1 個の変量効果項がある場合、G は、M 個のレベルまたはグループをもつ単一のグループ化変数に対応する n 行 1 列のベクトルでなければなりません。

    G には、カテゴリカル ベクトル、数値ベクトル、文字配列または文字列のセル配列のいずれかを指定できます。

  • 複数の変量効果項がある場合、G は長さ R のセル配列でなければなりません。G の各セルには、M(r) 個のレベルをもつグループ化変数 G{r}、r = 1, 2, ..., R が含まれています。

    G{r} には、カテゴリカル ベクトル、数値ベクトル、文字配列または文字列のセル配列のいずれかを指定できます。

データ型: single | double | char | cell

プロパティ

すべて展開する

固定効果の係数推定値とそれに関連する統計。以下のフィールドを含むデータセット配列として格納されます。

Name項の名前。
Estimate係数の推定値。
SE係数の標準誤差。
tStat係数が 0 になるという帰無仮説を検定するための t 統計。
DFt 検定に対する自由度。DF の計算方法は 'DFMethod' 名前と値のペア引数で指定します。Coefficients は常に 'Residual''DFMethod' メソッドに使用します。
pValuet 検定の p 値
Lower係数の信頼区間の下限。Coefficients は常に 95% の信頼度 (つまり 'alpha' が 0.05) を使用します。
Upper係数の信頼区間の上限。Coefficients は常に 95% の信頼度 (つまり 'alpha' が 0.05) を使用します。

'DFMethod''alpha' は、信頼区間の計算中または固定効果と変量効果を含む帰無仮説の検定中に、coefCI メソッドと coefTest メソッドを使用して変更できます。

線形混合効果モデルの固定効果係数の推定値の共分散。p 行 p 列の行列として格納されます。ここで p は固定効果係数の数です。

変量効果に関連する共分散パラメーターは、covarianceParameters メソッドを使用して表示できます。

データ型: double

線形混合効果モデルの固定効果係数の名前。1 行 p 列の文字列のセル配列として格納します。

データ型: cell

残差の自由度。正の整数値として格納されます。DFE = n - p で、n は観測値の数、p は固定効果係数の数です。

これは fixedEffects および randomEffects メソッドでの自由度の計算の 'Residual' メソッドに対応します。

データ型: double

線形混合効果モデルをあてはめる方法。以下のいずれかの文字列で格納されます。

  • あてはめの方法が最尤法の場合は ML

  • あてはめの方法が制限付き最尤法の場合は REML

データ型: char

線形混合効果モデルを定義する固定効果項、変量効果項およびグループ化変数の仕様。オブジェクトとして格納されます。

式を使用して近似するモデルを指定する方法の詳細については、を参照してください。

選択した近似法に応じた近似線形混合効果モデルの最大化された対数尤度または最大化された制限付き対数尤度。スカラー値として格納されます。

データ型: double

近似線形混合効果モデルを比較するためのモデル基準。以下の列をもつデータセット配列として格納します。

AIC赤池情報量基準
BICベイズ情報量基準
Loglikelihoodモデルの対数尤度値
Devianceモデルの対数尤度の –2 倍

n がモデルの近似に使用される観測の数で、p が固定効果係数の数である場合、AIC と BIC の計算に使用される値は以下のようになります。

  • パラメーターの総数は nc + p + 1 。ここで、nc は残差分散を除く変量効果の共分散のパラメーターの総数

  • 有効な観測の数は以下のとおりです。

    • あてはめの方法が最尤法 (ML) の場合は n

    • あてはめの方法が制限付き最尤法 (REML) の場合は n – p

σ2 の計算に使用される近似方法に基づく ML または REML の推定値。正のスカラー値として格納されます。σ2 は線形混合効果モデルの観測誤差項の残差分散または分散です。

データ型: double

近似線形混合効果モデルの固定効果係数の数。正の整数値として格納されます。

データ型: double

近似線形混合効果モデルの推定固定効果係数の数。正の整数値として格納されます。

データ型: double

近似に使用される観測の数。正の整数値として格納されます。これは、テーブルまたはデータセット配列または計画行列の行の数から、除外された行または NaN のある行を差し引いたものです。

データ型: double

線形混合効果モデルで予測子として使用される変数の数。正の整数値として格納されます。

データ型: double

応答や予測子を含む変数の総数。正の整数値として格納されます。

  • 標本データがテーブルまたはデータセット配列 tbl に格納されている場合、NumVariables は応答変数を含む tbl の変数の総数です。

  • 近似が行列入力に基づいている場合、NumVariables は予測子行列と応答ベクトルの列の総数です。

NumVariables には、予測子または応答として使用されない変数があればそれらが含まれます。

データ型: double

近似に使用される観測についての情報。テーブルとして格納します。

ObservationInfo には、観測ごとに 1 つの行と以下の 4 つの列があります。

Weights対象の観測の重み付き変数の値。既定値は 1 です。
Excluded名前と値のペア引数 'Exclude' を使用して観測を近似から除外した場合は true、それ以外の場合は false。1 は true を表し、0 は false を表します。
Missing応答または予測子の値が欠落しているために観測を近似から除外した場合は true、それ以外の場合は false

欠損値は、数値の場合は NaN、セル配列の場合は空のセル、文字配列の場合は空行、カテゴリカル配列の場合は <undefined> 値です。

Subset観測値が近似に使用された場合は true、欠落していたか除外されたため観測値に使用されなかった場合は false

データ型: table

近似に使用される観測の名前。文字列のセル配列として格納されます。

  • データが、観測名を含むテーブルまたはデータセット配列 tbl に含まれている場合、ObservationNames にはそれらの名前が格納されます。

  • データが、観測名を含まない行列、テーブルまたはデータセットにある場合、ObservationNames は空のセル配列です。

データ型: cell

近似で予測子として使用する変数の名前。NumPredictors と同じ長さの文字列のセル配列として格納されます。

データ型: cell

近似で応答変数として使用される変数の名前。文字列として格納されます。

データ型: char

近似モデルで説明される応答の変化率。構造体として格納されます。これは複数の相関係数または決定係数です。Rsquared には 2 つのフィールドがあります。

Ordinary決定係数値。構造体のスカラー値として格納されます。Rsquared.Ordinary = 1 – SSE./SST
Adjusted固定効果係数の数に対する自由度調整済み決定係数値。構造体のスカラー値として格納されます。

Rsquared.Adjusted = 1 – (SSE./SST)*(DFT./DFE)

ここで DFE = n – p および DFT = n – 1 です。n は観測値の総数、p は固定効果係数の数です。

データ型: struct

誤差二乗和、つまり二乗した条件付き残差の和。正のスカラー値として格納されます。

SSE = sum((y – F).^2)。ここで y は応答ベクトルで、F は線形混合効果モデルの近似条件付き応答です。条件付きモデルには、固定効果と変量効果の両方からの寄与が含まれます。

データ型: double

回帰二乗和、つまり線形混合効果回帰で説明される二乗和。正のスカラー値として格納されます。これは条件付き近似値を平均した偏差の二乗和です。

SSR = sum((F – mean(F)).^2)。ここで F は線形混合効果モデルの近似条件付き応答です。条件付きモデルには、固定効果と変量効果の両方からの寄与が含まれます。

データ型: double

二乗総和、つまり観察された応答値のその平均からの偏差の二乗和。正のスカラー値として格納されます。

SST = sum((y – mean(y)).^2) = SSR + SSE です。y は応答ベクトルです。

データ型: double

変数。テーブルとして格納します。

  • 近似がテーブルまたはデータセット配列 tbl に基づいている場合、Variablestbl と同じです。

  • 近似が行列入力に基づいている場合、Variables は予測子行列のすべての変数と応答変数が格納されたテーブルです。

データ型: table

近似に使用される変数についての情報。テーブルとして格納します。

VariableInfo には、観測ごとに 1 つの変数と以下の 4 つの列があります。

Class変数のクラス ('double''cell''nominal' など)。
Range変数の値の範囲。
  • 数値変数の場合は、[min,max] 形式の 2 要素ベクトルです。

  • セルまたはカテゴリカル変数の場合は、変数の一意の値をすべて含むセルまたはカテゴリカル配列です。

InModel変数が近似モデルの予測子である場合は true

変数が近似モデルに含まれていない場合は false

IsCategorical変数の型が、セル、論理、カテゴリカルなどのカテゴリカル予測子として処理される型である場合や、変数が fit メソッドの名前と値のペア引数 'Categorical' でカテゴリカルとして指定された場合は true

変数が連続予測子である場合は false

データ型: table

近似に使用される変数の名前。文字列のセル配列として格納されます。

  • 標本データがテーブルまたはデータセット配列 tbl に含まれている場合、VariableNames には tbl の変数の名前が格納されます。

  • 標本データが行列形式である場合、VariableInfo にはモデルの近似中に提供した変数名が格納されます。変数名を指定しなかった場合、VariableInfo には既定の名前が格納されます。

データ型: cell

メソッド

anova線形混合効果モデルの分散分析
coefCI 線形混合効果モデルの係数の信頼区間
coefTest線形混合効果モデルの固定効果と変量効果についての仮説検定
compare線形混合効果モデルの比較
covarianceParameters線形混合効果モデルの共分散パラメーターの抽出
designMatrix固定効果と変量効果の計画行列
disp線形混合効果モデルの表示
fitテーブルを使用した線形混合効果モデルの近似
fitmatrix 計画行列を使用して線形混合効果モデルを近似する
fitted線形混合効果モデルからの近似応答
fixedEffects固定効果と関連する統計の推定
plotResiduals線形混合効果モデルの残差のプロット
predict 線形混合効果モデルの応答予測
random 近似線形混合効果モデルからランダムな応答を生成します。
randomEffects 変量効果と関連する統計の推定
residuals近似線形混合効果モデルの残差
response線形混合効果モデルの応答ベクトル

定義

一般に、モデル仕様の式は 'y ~ terms' の形式の文字列です。線形混合効果モデルでは、この式は 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' の形式になります。ここで、fixed および random には固定効果および変量効果の項が含まれます。

テーブル tbl に以下のものが格納されていると仮定します。

  • 応答変数 y

  • 連続変数またはグループ化変数である予測子変数 Xj

  • グループ化変数 g1g2、...、gR

ここで、Xj および gr のグループ化変数は、カテゴリカル配列、論理配列、文字配列または文字列のセル配列です。

この場合、'y ~ fixed + (random1|g1) + ... + (randomR|gR)' の形式の式において、項 fixed は固定効果の計画行列 X の仕様に対応し、random1 はグループ化変数 g1 に対応する変量効果の計画行列 Z1 の仕様であり、同様に randomR はグループ化変数 gR に対応する変量効果の計画行列 ZR の仕様です。fixed 項および random 項はウィルキンソンの表記法で表現できます。

ウィルキンソンの表記法は、モデルに存在する因子を記述します。この表記法は、モデルに存在する因子に関係するものであり、それらの因子の乗数 (係数) に関係するものではありません。

ウィルキンソンの表記法標準表記の因子
1定数 (切片) 項
X^kk は正の整数XX2、...、Xk
X1 + X2X1X2
X1*X2X1X2X1.*X2 (X1 および X2 を要素ごとに乗算)
X1:X2X1.*X2 のみ
- X2X2 は含めない
X1*X2 + X3X1X2X3X1*X2
X1 + X2 + X3 + X1:X2X1X2X3X1*X2
X1*X2*X3 - X1:X2:X3X1X2X3X1*X2X1*X3X2*X3
X1*(X2 + X3)X1X2X3X1*X2X1*X3

Statistics and Machine Learning Toolbox™ 表記は、-1 を使用して項を明示的に削除しない限り、常に定数項を含みます。線形混合効果モデルの仕様例を次にいくつか挙げます。

次に例を示します。

説明
'y ~ X1 + X2'切片 X1 および X2 の固定効果。これは、'y ~ 1 + X1 + X2' と等価です。
'y ~ -1 + X1 + X2'X1X2 の切片と固定効果はありません。-1 を含めることによって暗黙的な切片の項は抑制されます。
'y ~ 1 + (1 | g1)'グループ化変数 g1 のレベルごとの切片の固定効果と切片の変量効果の和。
'y ~ X1 + (1 | g1)'固定勾配のランダム切片モデル。
'y ~ X1 + (X1 | g1)'相関がある可能性のあるランダムな切片と勾配。これは、'y ~ 1 + X1 + (1 + X1|g1)' と等価です。
'y ~ X1 + (1 | g1) + (-1 + X1 | g1)' 切片と勾配の独立した変量効果項。
'y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1:g2)'g1g2 に対する独立したメイン効果のあるランダムな切片モデル + 独立した交互作用効果。

コピーのセマンティクス

値。コピー操作に対する値クラスの影響については、MATLAB® のドキュメンテーションの「オブジェクトのコピー」を参照してください。

すべて展開する

標本データを読み込みます。

load flu

flu データセット配列には、Date 変数と、インフルエンザ推定罹患率を含む 10 個の変数が含まれます (Google® 検索から推定される 9 地域の値と、Center for Disease Control and Prevention (CDC) による全国の推定値)。

線形混合効果モデルを近似するには、データが適切な形式のデータセット配列になっていなければなりません。インフルエンザ罹患率を応答とし、地域を予測子変数として線形混合効果モデルをあてはめるには、地域に対応する 9 個の列を 1 つの高さ配列にまとめます。新しいデータセット配列 flu2 には、応答変数 FluRate、各推定の元になっている地域を示すノミナル変数 Region およびグループ化変数 Date が含まれなければなりません。

flu2 = stack(flu,2:10,'NewDataVarName','FluRate',...
    'IndVarName','Region');
flu2.Date = nominal(flu2.Date);

地域に対する固定効果と、Date で変化するランダム切片で、線形混合効果モデルを近似します。

地域はノミナル変数であるため、fitlme は最初の地域 NE を参照として受け取り、他の 8 つの地域を表す 8 つのダミー変数を作成します。たとえば、I[MidAtl] は地域 MidAtl を表すダミー変数です。詳細は、ダミー指標変数を参照してください。

対応するモデルは次のようになります。

yim=β0+β1I[MidAtl]i+β2I[ENCentral]i+β3I[WNCentral]i+β4I[SAtl]i+β5I[ESCentral]i+β6I[WSCentral]i+β7I[Mtn]i+β8I[Pac]i+b0m+εim,m=1,2,...,52,

ここで、yim はグループ化変数 Date のレベル m に対応する観測値 i、βj (j = 0, 1, ..., 8) は固定効果係数、b0m はグループ化変数 Date のレベル m に対応する変量効果、εim は観測値 i の観測誤差です。変量効果は事前分布 b ~ N(0,σ2b) をもち、誤差項は分布 ε ~ N(0,σ2) をもちます。

lme = fitlme(flu2,'FluRate ~ 1 + Region + (1|Date)')
Linear mixed-effects model fit by ML

Model information:
    Number of observations             468
    Fixed effects coefficients           9
    Random effects coefficients         52
    Covariance parameters                2

Formula:
    FluRate ~ 1 + Region + (1|Date)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    318.71    364.35    -148.36          296.71  

Fixed effects coefficients (95% CIs):
    Name                      Estimate    SE          tStat      DF     pValue        Lower        Upper    
    '(Intercept)'               1.2233    0.096678     12.654    459     1.085e-31       1.0334       1.4133
    'Region_MidAtl'           0.010192    0.052221    0.19518    459       0.84534    -0.092429      0.11281
    'Region_ENCentral'        0.051923    0.052221     0.9943    459        0.3206    -0.050698      0.15454
    'Region_WNCentral'         0.23687    0.052221     4.5359    459    7.3324e-06      0.13424      0.33949
    'Region_SAtl'             0.075481    0.052221     1.4454    459       0.14902     -0.02714       0.1781
    'Region_ESCentral'         0.33917    0.052221      6.495    459    2.1623e-10      0.23655      0.44179
    'Region_WSCentral'           0.069    0.052221     1.3213    459       0.18705    -0.033621      0.17162
    'Region_Mtn'              0.046673    0.052221    0.89377    459       0.37191    -0.055948      0.14929
    'Region_Pac'              -0.16013    0.052221    -3.0665    459     0.0022936     -0.26276    -0.057514

Random effects covariance parameters (95% CIs):
Group: Date (52 Levels)
    Name1                Name2                Type         Estimate    Lower     Upper  
    '(Intercept)'        '(Intercept)'        'std'        0.6443      0.5297    0.78368

Group: Error
    Name             Estimate    Lower      Upper
    'Res Std'        0.26627     0.24878    0.285

p 値 7.3324e-06 および 2.1623e-10 は、地域 WNCentral および ESCentral のインフルエンザ罹患率の固定効果が地域 NE のインフルエンザ罹患率に対して有意差があることをそれぞれ示しています。

変量効果の項 σ2b の標準偏差の信頼限界には、変量効果の項が有意であることを示す 0 (0.5297, 0.78368) が含まれません。compare メソッドを使用して、変量効果の項の有意性をテストすることもできます。

観測値の推定値は、その観測値に対応するグループ化変数レベルの固定効果および変量効果の値の合計です。たとえば、2005 年 10 月 9 日の週における地域 WNCentral の推定最良線形不偏予測量 (BLUP) は次のようになります。

y^WNCentral,10/9/2005=β^0+β^3I[WNCentral]+b^10/9/2005=1.2233+0.236870.1718=1.28837.

固定効果と変量効果の両方が推定に寄与しているので、これは近似条件付き応答です。この値を以下のように計算することもできます。

beta = fixedEffects(lme);
[~,~,STATS] = randomEffects(lme); % Compute the random-effects statistics (STATS)
STATS.Level = nominal(STATS.Level);
y_hat = beta(1) + beta(4) + STATS.Estimate(STATS.Level=='10/9/2005')
y_hat =

    1.2884

fitted メソッドを使用して、近似値を簡単に表示できます。

F = fitted(lme);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')
ans =

    1.2884

2005 年 10 月 9 日の週における地域 WNCentral の近似限界応答を計算します。

F = fitted(lme,'Conditional',false);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')
ans =

    1.4602

標本データを読み込みます。

load carbig

ガロンあたりの走行マイル数 (MPG) の線形混合効果モデルを近似します。加速度、馬力、気筒数は固定効果で、モデル年度によってグループ化される切片と加速度については相関された変量効果の可能性があります。このモデルは次の式に対応します。

MPGim=β0+β1Acci+β2HP+b0m+b1mAccim+εim,m=1,2,3,

変量効果項の事前分布は次のようになります。

bm=(b0mb1m)~N(0,(σ02σ0,1σ0,1σ12)),

ここで、D(θ) は共分散行列です。

最初に、線形混合効果モデルを近似するための計画行列を準備します。

X = [ones(406,1) Acceleration Horsepower];
Z = [ones(406,1) Acceleration];
Model_Year = nominal(Model_Year);
G = Model_Year;

次に、定義した計画行列とグループ化変数で fitlmematrix を使用してモデルを近似します。'fminunc' 最適化アルゴリズムを使用します。

lme = fitlmematrix(X,MPG,Z,G,'FixedEffectPredictors',....
{'Intercept','Acceleration','Horsepower'},'RandomEffectPredictors',...
{{'Intercept','Acceleration'}},'RandomEffectGroups',{'Model_Year'},...
'FitMethod','REML')
lme = 


Linear mixed-effects model fit by REML

Model information:
    Number of observations             392
    Fixed effects coefficients           3
    Random effects coefficients         26
    Covariance parameters                4

Formula:
    y ~ Intercept + Acceleration + Horsepower + (Intercept + Acceleration | Model_Year)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    2202.9    2230.7    -1094.5          2188.9  

Fixed effects coefficients (95% CIs):
    Name                  Estimate    SE           tStat      DF     pValue        Lower       Upper   
    'Intercept'             50.064       2.3176     21.602    389    1.4185e-68      45.507       54.62
    'Acceleration'        -0.57897      0.13843    -4.1825    389    3.5654e-05    -0.85112    -0.30681
    'Horsepower'          -0.16958    0.0073242    -23.153    389    3.5289e-75    -0.18398    -0.15518

Random effects covariance parameters (95% CIs):
Group: Model_Year (13 Levels)
    Name1                 Name2                 Type          Estimate    Lower       Upper   
    'Intercept'           'Intercept'           'std'            3.72       1.5215      9.0954
    'Acceleration'        'Intercept'           'corr'        -0.8769     -0.98275    -0.33845
    'Acceleration'        'Acceleration'        'std'          0.3593      0.19418     0.66483

Group: Error
    Name             Estimate    Lower     Upper 
    'Res Std'        3.6913      3.4331    3.9688

固定効果係数の表示には、推定値、標準誤差 (SE) および 95% 信頼区間の限界 (Lower および Upper) が含まれます。(pValue) の p 値は、3 つすべての固定効果係数が有意であることを示しています。

標準偏差の信頼区間と、切片に対する変量効果と加速度の間の相関には 0 は含まれていません。そのため、これらは有意と考えられます。変量効果を検定するには、compare メソッドを使用します。

推定固定効果係数の共分散行列を表示します。

lme.CoefficientCovariance
ans =

    5.3711   -0.2809   -0.0126
   -0.2809    0.0192    0.0005
   -0.0126    0.0005    0.0001

対角要素は、固定効果係数の推定値の分散を示しています。たとえば、切片の推定値の分散は 5.3711 です。推定値の標準誤差は分散の平方根です。たとえば、切片の標準誤差は 2.3176 (sqrt(5.3711)) です。

非対角要素は、固定効果係数の推定値間の相関を示しています。たとえば、切片と加速度間の相関は –0.2809 で、加速度と馬力間の相関は 0.0005 です。

モデルの決定係数を表示します。

lme.Rsquared
ans = 

    Ordinary: 0.7826
    Adjusted: 0.7815

調整値は、モデルの予測子の数に対する自由度調整済み決定係数値です。

この情報は役に立ちましたか?