Main Content

LinearMixedModel

線形混合効果モデル

説明

LinearMixedModel オブジェクトは、固定効果と変量効果をもつ応答変数を表します。このオブジェクトは、モデルの説明、近似係数、共分散パラメーター、計画行列、残差、残差プロットおよび線形混合効果モデル クラスのその他の診断情報で構成されます。predict 関数を使用してモデルの応答を予測でき、random 関数を使用して新しい設計点に乱数データを生成できます。

作成

LinearMixedModel モデルの作成には fitlme または fitlmematrix を使用します。データがテーブルまたはデータセット配列に格納されている場合は、fitlme(tbl,formula) を使用して線形混合効果モデルを当てはめることができます。あるいは、式で表現することが困難なモデルの場合は、固定効果と変量効果を定義する行列を作成し、fitlmematrix(X,y,Z,G) を使用してモデルを当てはめることができます。

プロパティ

すべて展開する

係数推定値

固定効果の係数推定値とそれに関連する統計。以下のフィールドを含むデータセット配列として格納されます。

Name項の名前。
Estimate係数の推定値。
SE係数の標準誤差。
tStat係数が 0 になるという帰無仮説を検定するための t 統計。
DFt 検定に対する自由度。DF の計算方法は 'DFMethod' 名前と値のペア引数で指定します。Coefficients は常に 'Residual''DFMethod' メソッドに使用します。
pValuet 検定の p 値
Lower係数の信頼区間の下限。Coefficients は常に 95% の信頼水準 (つまり 'alpha' が 0.05) を使用します。
Upper係数の信頼区間の上限。Coefficients は常に 95% の信頼水準 (つまり 'alpha' が 0.05) を使用します。

'DFMethod''alpha' は、信頼区間の計算中または固定効果と変量効果を含む帰無仮説の検定中に、coefCI メソッドと coefTest メソッドを使用して変更できます。

線形混合効果モデルの固定効果係数の推定値の共分散。p 行 p 列の行列として格納されます。ここで p は固定効果係数の数です。

変量効果に関連する共分散パラメーターは、covarianceParameters メソッドを使用して表示できます。

データ型: double

線形混合効果モデルの固定効果係数の名前。1 行 p 列の文字ベクトルの cell 配列として格納されます。

データ型: cell

近似線形混合効果モデルの固定効果係数の数。正の整数値として格納されます。

データ型: double

近似線形混合効果モデルの推定固定効果係数の数。正の整数値として格納されます。

データ型: double

近似法

線形混合効果モデルを当てはめる方法。以下のいずれかとして格納されます。

  • 当てはめの方法が最尤法の場合は ML

  • 当てはめの方法が制限付き最尤法の場合は REML

データ型: char

入力データ

線形混合効果モデルを定義する固定効果項、変量効果項およびグループ化変数の仕様。オブジェクトとして格納されます。

式を使用して近似するモデルを指定する方法の詳細については、を参照してください。

近似に使用される観測の数。正の整数値として格納されます。これは、テーブルまたはデータセット配列または計画行列の行の数から、除外された行または NaN のある行を差し引いたものです。

データ型: double

線形混合効果モデルで予測子として使用される変数の数。正の整数値として格納されます。

データ型: double

応答や予測子を含む変数の総数。正の整数値として格納されます。

  • 標本データがテーブルまたはデータセット配列 tbl に格納されている場合、NumVariables は応答変数を含む tbl の変数の総数です。

  • 近似が行列入力に基づいている場合、NumVariables は予測子行列と応答ベクトルの列の総数です。

NumVariables には、予測子または応答として使用されない変数があればそれらが含まれます。

データ型: double

近似に使用される観測についての情報。テーブルとして格納します。

ObservationInfo には、観測ごとに 1 つの行と以下の 4 つの列があります。

Weights対象の観測の重み付き変数の値。既定値は 1 です。
Excluded名前と値のペア引数 'Exclude' を使用して観測を近似から除外した場合は true、それ以外の場合は false。1 は true を表し、0 は false を表します。
Missing

応答または予測子の値が欠落しているために観測を近似から除外した場合は true、それ以外の場合は false

欠損値は、数値の場合は NaN、cell 配列の場合は空のセル、文字配列の場合は空行、categorical 配列の場合は <undefined> 値です。

Subset観測値が近似に使用された場合は true、欠落していたか除外されたため観測値に使用されなかった場合は false

データ型: table

当てはめに使用される観測値の名前。文字ベクトルの cell 配列として格納されます。

  • データが、観測名を含むテーブルまたはデータセット配列 tbl に含まれている場合、ObservationNames にはそれらの名前が格納されます。

  • データが、観測名を含まない行列、テーブルまたはデータセットにある場合、ObservationNames は空の cell 配列です。

データ型: cell

当てはめで予測子として使用する変数の名前。NumPredictors と同じ長さの文字ベクトルの cell 配列として格納されます。

データ型: cell

当てはめで応答変数として使用される変数の名前。文字ベクトルとして格納されます。

データ型: char

変数。テーブルとして格納します。

  • 近似がテーブルまたはデータセット配列 tbl に基づいている場合、Variablestbl と同じです。

  • 近似が行列入力に基づいている場合、Variables は予測子行列のすべての変数と応答変数が格納されたテーブルです。

データ型: table

近似に使用される変数についての情報。テーブルとして格納します。

VariableInfo には、観測ごとに 1 つの変数と以下の 4 つの列があります。

Class変数のクラス ('double''cell''nominal' など)。
Range

変数の値の範囲。

  • 数値変数の場合は、[min,max] 形式の 2 要素ベクトルです。

  • セルまたはカテゴリカル変数の場合は、変数の一意の値をすべて含むセルまたは categorical 配列です。

InModel

変数が近似モデルの予測子である場合は true

変数が近似モデルに含まれていない場合は false

IsCategorical

変数の型が、セル、論理、カテゴリカルなどのカテゴリカル予測子として処理される型である場合や、変数が fit メソッドの名前と値のペア引数 'Categorical' でカテゴリカルとして指定された場合は true

変数が連続予測子である場合は false

データ型: table

当てはめで使用する変数の名前。文字ベクトルの cell 配列として格納されます。

  • 標本データがテーブルまたはデータセット配列 tbl に含まれている場合、VariableNames には tbl の変数の名前が格納されます。

  • 標本データが行列形式である場合、VariableInfo にはモデルの近似中に提供した変数名が格納されます。変数名を指定しなかった場合、VariableInfo には既定の名前が格納されます。

データ型: cell

要約統計量

残差の自由度。正の整数値として格納されます。DFE = n - p で、n は観測値の数、p は固定効果係数の数です。

これは fixedEffects および randomEffects メソッドでの自由度の計算の 'Residual' メソッドに対応します。

データ型: double

選択した近似法に応じた近似線形混合効果モデルの最大化された対数尤度または最大化された制限付き対数尤度。スカラー値として格納されます。

データ型: double

近似線形混合効果モデルを比較するためのモデル基準。以下の列をもつデータセット配列として格納します。

AIC赤池情報量基準
BICベイズ情報量基準
Loglikelihoodモデルの対数尤度値
Devianceモデルの対数尤度の –2 倍

n がモデルによる近似に使用される観測の数で、p が固定効果係数の数である場合、AIC と BIC の計算に使用される値は以下のようになります。

  • パラメーターの総数は nc + p + 1 。ここで、nc は残差分散を除く変量効果の共分散のパラメーターの総数

  • 有効な観測の数は以下のとおりです。

    • 当てはめの方法が最尤法 (ML) の場合は n

    • 当てはめの方法が制限付き最尤法 (REML) の場合は n – p

σ2 の計算に使用される近似方法に基づく ML または REML の推定値。正のスカラー値として格納されます。σ2 は線形混合効果モデルの観測誤差項の残差分散または分散です。

データ型: double

近似モデルで説明される応答の変動性の比率。構造体として格納されます。これは複数の相関係数または決定係数です。Rsquared には 2 つのフィールドがあります。

Ordinary決定係数値。構造体のスカラー値として格納されます。Rsquared.Ordinary = 1 – SSE./SST
Adjusted

固定効果係数の数に対する自由度調整済み決定係数値。構造体のスカラー値として格納されます。

Rsquared.Adjusted = 1 – (SSE./SST)*(DFT./DFE),

ここで DFE = n – p および DFT = n – 1 です。n は観測値の総数、p は固定効果係数の数です。

データ型: struct

誤差二乗和。正のスカラーを指定します。SSE は二乗した条件付き残差に等しい値で、次のようになります。

SSE = sum((y – F).^2),

ここで y は応答ベクトルで、F は線形混合効果モデルの近似条件付き応答です。条件付きモデルには、固定効果と変量効果の両方からの寄与が含まれます。

観測値の重みを使用して学習させたモデルの場合、SSE の計算の二乗和は重み付き二乗和です。

データ型: double

回帰二乗和。正のスカラーを指定します。SSR は線形混合効果回帰で説明される二乗和で、当てはめた値と応答の平均の間における偏差の二乗和に等しい値です。

SSR = sum((F – mean(y)).^2),

ここで F は線形混合効果モデルの近似条件付き応答で、y は応答ベクトルです。条件付きモデルには、固定効果と変量効果の両方からの寄与が含まれます。

観測値の重みを使用して学習させたモデルの場合、SSR の計算の二乗和は重み付き二乗和です。

データ型: double

二乗総和。正のスカラーを指定します。

切片をもつ線形混合効果モデルでは、SST は次のように計算されます。

SST = SSE + SSR,

ここで、SST は二乗総和、SSE は残差平方和、SSR は回帰二乗和です。

切片のない線形混合効果モデルでは、SST は観察された応答値のその平均からの偏差の二乗和として計算され、次のようになります。

SST = sum((y – mean(y)).^2),

ここで、y は応答ベクトルです。

観測値の重みを使用して学習させたモデルの場合、SST の計算の二乗和は重み付き二乗和です。

データ型: double

オブジェクト関数

anova線形混合効果モデルの分散分析
coefCI 線形混合効果モデルの係数の信頼区間
coefTest線形混合効果モデルの固定効果と変量効果についての仮説検定
compare線形混合効果モデルの比較
covarianceParameters線形混合効果モデルの共分散パラメーターの抽出
designMatrix固定効果と変量効果の計画行列
fitted線形混合効果モデルからの近似応答
fixedEffects固定効果と関連する統計の推定
partialDependence部分依存の計算
plotPartialDependence部分依存プロット (PDP) および個別条件付き期待値 (ICE) プロットの作成
plotResiduals線形混合効果モデルの残差のプロット
predict 線形混合効果モデルの応答予測
random 近似線形混合効果モデルからのランダム応答の生成
randomEffects 変量効果と関連する統計の推定
residuals近似線形混合効果モデルの残差
response線形混合効果モデルの応答ベクトル

すべて折りたたむ

標本データを読み込みます。

load flu

データセット配列 flu には、変数 Date と、インフルエンザ推定罹患率 (Google® 検索から推定される 9 地域の値と疾病対策センター (CDC) による全国の推定値) が格納されている 10 個の変数が含まれています。

線形混合効果モデルを当てはめるには、データが適切な形式のデータセット配列になっていなければなりません。インフルエンザ罹患率を応答として、地域を予測子変数として線形混合効果モデルを当てはめるため、地域に対応する 9 個の列を 1 つの配列にまとめます。新しいデータセット配列 flu2 には、応答変数 FluRate、各推定の元になっている地域を示すノミナル変数 Region およびグループ化変数 Date が含まれなければなりません。

flu2 = stack(flu,2:10,'NewDataVarName','FluRate',...
    'IndVarName','Region');
flu2.Date = nominal(flu2.Date);

地域に対する固定効果と、Date で変化するランダム切片で、線形混合効果モデルを当てはめます。

地域はノミナル変数であるため、fitlme は最初の地域 NE を参照として受け取り、他の 8 つの地域を表す 8 つのダミー変数を作成します。たとえば、I[MidAtl] は地域 MidAtl を表すダミー変数です。詳細については、ダミー変数を参照してください。

対応するモデルは以下のとおりです。

yim=β0+β1I[MidAtl]i+β2I[ENCentral]i+β3I[WNCentral]i+β4I[SAtl]i+β5I[ESCentral]i+β6I[WSCentral]i+β7I[Mtn]i+β8I[Pac]i+b0m+εim,m=1,2,...,52,

ここで、yim はグループ化変数 Date の水準 m に対する観測値 iβj は固定効果係数 (j = 0、1、...、8)、b0m はグループ化変数 Date の水準 m に対する変量効果、εim は観測値 i の観測誤差です。変量効果の事前分布は b0mN(0,σb2)、誤差項の分布は εimN(0,σ2) です。

lme = fitlme(flu2,'FluRate ~ 1 + Region + (1|Date)')
lme = 
Linear mixed-effects model fit by ML

Model information:
    Number of observations             468
    Fixed effects coefficients           9
    Random effects coefficients         52
    Covariance parameters                2

Formula:
    FluRate ~ 1 + Region + (1 | Date)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    318.71    364.35    -148.36          296.71  

Fixed effects coefficients (95% CIs):
    Name                        Estimate    SE          tStat      DF     pValue        Lower        Upper    
    {'(Intercept)'     }          1.2233    0.096678     12.654    459     1.085e-31       1.0334       1.4133
    {'Region_MidAtl'   }        0.010192    0.052221    0.19518    459       0.84534    -0.092429      0.11281
    {'Region_ENCentral'}        0.051923    0.052221     0.9943    459        0.3206    -0.050698      0.15454
    {'Region_WNCentral'}         0.23687    0.052221     4.5359    459    7.3324e-06      0.13424      0.33949
    {'Region_SAtl'     }        0.075481    0.052221     1.4454    459       0.14902     -0.02714       0.1781
    {'Region_ESCentral'}         0.33917    0.052221      6.495    459    2.1623e-10      0.23655      0.44179
    {'Region_WSCentral'}           0.069    0.052221     1.3213    459       0.18705    -0.033621      0.17162
    {'Region_Mtn'      }        0.046673    0.052221    0.89377    459       0.37191    -0.055948      0.14929
    {'Region_Pac'      }        -0.16013    0.052221    -3.0665    459     0.0022936     -0.26276    -0.057514

Random effects covariance parameters (95% CIs):
Group: Date (52 Levels)
    Name1                  Name2                  Type           Estimate    Lower     Upper  
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.6443      0.5297    0.78368

Group: Error
    Name               Estimate    Lower      Upper
    {'Res Std'}        0.26627     0.24878    0.285

p 値 7.3324e-06 および 2.1623e-10 は、地域 WNCentral および ESCentral のインフルエンザ罹患率の固定効果が地域 NE のインフルエンザ罹患率に対して有意に異なることをそれぞれ示しています。

変量効果項の標準偏差 σb の信頼限界 (0.5297, 0.78368) には、変量効果項が有意であることを示す 0 が含まれていません。compare メソッドを使用して、変量効果の項の有意性をテストすることもできます。

観測値の推定値は、その観測値に対応するグループ化変数水準の固定効果および変量効果の値の合計です。たとえば、2005 年 10 月 9 日の週における地域 WNCentral の罹患率に対する最良線形不偏予測量 (BLUP) の推定値は次のようになります。

yˆWNCentral,10/9/2005=βˆ0+βˆ3I[WNCentral]+bˆ10/9/2005=1.2233+0.23687-0.1718=1.28837.

固定効果と変量効果の両方による推定に対する寄与が含まれているので、これは近似された条件付き応答です。この値を以下のように計算することもできます。

beta = fixedEffects(lme);
[~,~,STATS] = randomEffects(lme); % Compute the random-effects statistics (STATS)
STATS.Level = nominal(STATS.Level);
y_hat = beta(1) + beta(4) + STATS.Estimate(STATS.Level=='10/9/2005')
y_hat = 1.2884

fitted メソッドを使用して、近似値を簡単に表示できます。

F = fitted(lme);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')
ans = 1.2884

2005 年 10 月 9 日の週における地域 WNCentral の近似限界応答を計算します。

F = fitted(lme,'Conditional',false);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')
ans = 1.4602

標本データを読み込みます。

load carbig

ガロンあたりの走行マイル数 (MPG) の線形混合効果モデルを当てはめます。ここで、加速度、馬力、気筒数は固定効果で、モデル年度によってグループ化される切片と加速度は無相関の変量効果です。このモデルは以下に対応します。

MPGim=β0+β1Acci+β2HP+b0m+b1mAccim+εim,m=1,2,3,

変量効果項の事前分布は次のようになります。

bm=(b0mb1m)N(0,(σ02σ0,1σ0,1σ12)),

ここで、m はモデル年を表します。

最初に、線形混合効果モデルを当てはめるための計画行列を準備します。

X = [ones(406,1) Acceleration Horsepower];
Z = [ones(406,1) Acceleration];
Model_Year = nominal(Model_Year);
G = Model_Year;

次に、定義した計画行列とグループ化変数で fitlmematrix を使用してモデルを当てはめます。'fminunc' 最適化アルゴリズムを使用します。

lme = fitlmematrix(X,MPG,Z,G,'FixedEffectPredictors',....
{'Intercept','Acceleration','Horsepower'},'RandomEffectPredictors',...
{{'Intercept','Acceleration'}},'RandomEffectGroups',{'Model_Year'},...
'FitMethod','REML')
lme = 
Linear mixed-effects model fit by REML

Model information:
    Number of observations             392
    Fixed effects coefficients           3
    Random effects coefficients         26
    Covariance parameters                4

Formula:
    y ~ Intercept + Acceleration + Horsepower + (Intercept + Acceleration | Model_Year)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    2202.9    2230.7    -1094.5          2188.9  

Fixed effects coefficients (95% CIs):
    Name                    Estimate    SE           tStat      DF     pValue        Lower       Upper   
    {'Intercept'   }          50.064       2.3176     21.602    389    1.4185e-68      45.507       54.62
    {'Acceleration'}        -0.57897      0.13843    -4.1825    389    3.5654e-05    -0.85112    -0.30681
    {'Horsepower'  }        -0.16958    0.0073242    -23.153    389    3.5289e-75    -0.18398    -0.15518

Random effects covariance parameters (95% CIs):
Group: Model_Year (13 Levels)
    Name1                   Name2                   Type            Estimate    Lower       Upper   
    {'Intercept'   }        {'Intercept'   }        {'std' }           3.72       1.5215      9.0954
    {'Acceleration'}        {'Intercept'   }        {'corr'}        -0.8769     -0.98274    -0.33846
    {'Acceleration'}        {'Acceleration'}        {'std' }         0.3593      0.19418     0.66483

Group: Error
    Name               Estimate    Lower     Upper 
    {'Res Std'}        3.6913      3.4331    3.9688

固定効果係数の表示には、推定値、標準誤差 (SE) および 95% 信頼区間の限界 (Lower および Upper) が含まれます。p 値 (pValue) は、3 つの固定効果係数がすべて有意であることを示しています。

標準偏差の信頼区間と、切片に対する変量効果と加速度の間の相関には 0 は含まれていません。そのため、これらは有意と考えられます。変量効果を検定するには、compare メソッドを使用します。

推定固定効果係数の共分散行列を表示します。

lme.CoefficientCovariance
ans = 3×3

    5.3711   -0.2809   -0.0126
   -0.2809    0.0192    0.0005
   -0.0126    0.0005    0.0001

対角要素は、固定効果係数の推定値の分散を示しています。たとえば、切片の推定値の分散は 5.3711 です。推定値の標準誤差は分散の平方根です。たとえば、切片の標準誤差は 2.3176 (sqrt(5.3711)) です。

非対角要素は、固定効果係数の推定値間の相関を示しています。たとえば、切片と加速度間の相関は –0.2809 で、加速度と馬力間の相関は 0.0005 です。

モデルの決定係数を表示します。

lme.Rsquared
ans = struct with fields:
    Ordinary: 0.7866
    Adjusted: 0.7855

調整値は、モデルの予測子の数に対する自由度調整済み決定係数値です。

詳細

すべて展開する

バージョン履歴

R2013b で導入