ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

LinearMixedModel クラス

線形混合効果モデル クラス

説明

LinearMixedModel オブジェクトは、固定効果と変量効果をもつ応答変数を表します。このオブジェクトは、モデルの説明、近似係数、共分散パラメーター、計画行列、残差、残差プロットおよび線形混合効果モデル クラスのその他の診断情報で構成されます。predict 関数を使用してモデルの応答を予測でき、random 関数を使用して新しい設計点に乱数データを生成できます。

構築

データがテーブルまたはデータセット配列に格納されている場合は、fitlme(tbl,formula) を使用して線形混合効果モデルを近似できます。または、式を使用したモデルの記述が困難な場合は、固定効果と変量効果を定義する行列を作成し、fitlmematrix(X,y,Z,G) を使用してモデルを近似できます。

入力引数

すべて展開する

入力データ。テーブルまたは配列 dataset として指定された、応答変数、予測子変数およびグループ化変数を含みます。予測子変数は、連続変数またはグループ化変数にすることができます (グループ化変数を参照してください)。formula を使用して、変数のモデルを指定しなければなりません。

データ型: テーブル

モデル仕様の式。'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' という形式の文字ベクトルまたは string スカラーを指定します。詳細は、を参照してください。

例: 'y ~ treatment +(1|block)'

n 行 p 列の行列として指定される固定効果の計画行列。ここで、n は観測値の数、p は固定効果の予測子変数の数です。X の各行は 1 つの観測値に対応し、X の各列は 1 つの変数に対応します。

データ型: single | double

n 行 1 列のベクトルとして指定された応答値。ここで、n は観測値の数です。

データ型: single | double

変量効果の計画。以下のいずれかとして指定します。

  • モデルに 1 個の変量効果項がある場合、Z は n 行 q 列の行列でなければなりません。n は観測値の数、q は変量効果項の変数の数です。

  • R 個の変量効果項がある場合、Z は長さ R の cell 配列でなければなりません。Z の各セルには、各変量効果項に対応する、n 行 q (r) 列の計画行列 Z{r}、r = 1, 2, ..., R が含まれています。ここで、q (r) は、r 番目の変量効果の計画行列 Z{r} の変量効果項の数です。

データ型: single | double | cell

グループ化変数。次のいずれかとして指定します。

  • 1 個の変量効果項がある場合、G は、M 個のレベルまたはグループをもつ単一のグループ化変数に対応する n 行 1 列のベクトルでなければなりません。

    G は、categorical ベクトル、logical ベクトル、数値ベクトル、文字配列、string 配列、または文字ベクトルの cell 配列が可能です。

  • 複数の変量効果項がある場合、G は長さ R の cell 配列でなければなりません。G の各セルには、M(r) 個のレベルをもつグループ化変数 G{r}、r = 1, 2, ..., R が含まれています。

    G{r} は、categorical ベクトル、logical ベクトル、数値ベクトル、文字配列、string 配列、または文字ベクトルの cell 配列が可能です。

データ型: カテゴリカル | logical | single | double | char | string | cell

プロパティ

すべて展開する

固定効果の係数推定値とそれに関連する統計。以下のフィールドを含むデータセット配列として格納されます。

Name項の名前。
Estimate係数の推定値。
SE係数の標準誤差。
tStat係数が 0 になるという帰無仮説を検定するための t 統計。
DFt 検定に対する自由度。DF の計算方法は 'DFMethod' 名前と値のペア引数で指定します。Coefficients は常に 'Residual''DFMethod' メソッドに使用します。
pValuet 検定の p 値
Lower係数の信頼区間の下限。Coefficients は常に 95% の信頼度 (つまり 'alpha' が 0.05) を使用します。
Upper係数の信頼区間の上限。Coefficients は常に 95% の信頼度 (つまり 'alpha' が 0.05) を使用します。

'DFMethod''alpha' は、信頼区間の計算中または固定効果と変量効果を含む帰無仮説の検定中に、coefCI メソッドと coefTest メソッドを使用して変更できます。

線形混合効果モデルの固定効果係数の推定値の共分散。p 行 p 列の行列として格納されます。ここで p は固定効果係数の数です。

変量効果に関連する共分散パラメーターは、covarianceParameters メソッドを使用して表示できます。

データ型: double

線形混合効果モデルの固定効果係数の名前。1 行 p 列の文字ベクトルの cell 配列として格納されます。

データ型: cell

残差の自由度。正の整数値として格納されます。DFE = n - p で、n は観測値の数、p は固定効果係数の数です。

これは fixedEffects および randomEffects メソッドでの自由度の計算の 'Residual' メソッドに対応します。

データ型: double

線形混合効果モデルをあてはめる方法。以下のいずれかとして格納されます。

  • あてはめの方法が最尤法の場合は ML

  • あてはめの方法が制限付き最尤法の場合は REML

データ型: char

線形混合効果モデルを定義する固定効果項、変量効果項およびグループ化変数の仕様。オブジェクトとして格納されます。

式を使用して近似するモデルを指定する方法の詳細については、を参照してください。

選択した近似法に応じた近似線形混合効果モデルの最大化された対数尤度または最大化された制限付き対数尤度。スカラー値として格納されます。

データ型: double

近似線形混合効果モデルを比較するためのモデル基準。以下の列をもつデータセット配列として格納します。

AIC赤池情報量基準
BICベイズ情報量基準
Loglikelihoodモデルの対数尤度値
Devianceモデルの対数尤度の –2 倍

n がモデルの近似に使用される観測の数で、p が固定効果係数の数である場合、AIC と BIC の計算に使用される値は以下のようになります。

  • パラメーターの総数は nc + p + 1 。ここで、nc は残差分散を除く変量効果の共分散のパラメーターの総数

  • 有効な観測の数は以下のとおりです。

    • あてはめの方法が最尤法 (ML) の場合は n

    • あてはめの方法が制限付き最尤法 (REML) の場合は n – p

σ2 の計算に使用される近似方法に基づく ML または REML の推定値。正のスカラー値として格納されます。σ2 は線形混合効果モデルの観測誤差項の残差分散または分散です。

データ型: double

近似線形混合効果モデルの固定効果係数の数。正の整数値として格納されます。

データ型: double

近似線形混合効果モデルの推定固定効果係数の数。正の整数値として格納されます。

データ型: double

近似に使用される観測の数。正の整数値として格納されます。これは、テーブルまたはデータセット配列または計画行列の行の数から、除外された行または NaN のある行を差し引いたものです。

データ型: double

線形混合効果モデルで予測子として使用される変数の数。正の整数値として格納されます。

データ型: double

応答や予測子を含む変数の総数。正の整数値として格納されます。

  • 標本データがテーブルまたはデータセット配列 tbl に格納されている場合、NumVariables は応答変数を含む tbl の変数の総数です。

  • 近似が行列入力に基づいている場合、NumVariables は予測子行列と応答ベクトルの列の総数です。

NumVariables には、予測子または応答として使用されない変数があればそれらが含まれます。

データ型: double

近似に使用される観測についての情報。テーブルとして格納します。

ObservationInfo には、観測ごとに 1 つの行と以下の 4 つの列があります。

Weights対象の観測の重み付き変数の値。既定値は 1 です。
Excluded名前と値のペア引数 'Exclude' を使用して観測を近似から除外した場合は true、それ以外の場合は false。1 は true を表し、0 は false を表します。
Missing

応答または予測子の値が欠落しているために観測を近似から除外した場合は true、それ以外の場合は false

欠損値は、数値の場合は NaN、cell 配列の場合は空のセル、文字配列の場合は空行、categorical 配列の場合は <undefined> 値です。

Subset観測値が近似に使用された場合は true、欠落していたか除外されたため観測値に使用されなかった場合は false

データ型: テーブル

あてはめに使用される観測値の名前。文字ベクトルの cell 配列として格納されます。

  • データが、観測名を含むテーブルまたはデータセット配列 tbl に含まれている場合、ObservationNames にはそれらの名前が格納されます。

  • データが、観測名を含まない行列、テーブルまたはデータセットにある場合、ObservationNames は空の cell 配列です。

データ型: cell

あてはめで予測子として使用する変数の名前。NumPredictors と同じ長さの文字ベクトルの cell 配列として格納されます。

データ型: cell

あてはめで応答変数として使用される変数の名前。文字ベクトルとして格納されます。

データ型: char

近似モデルで説明される応答の変動性の比率。構造体として格納されます。これは複数の相関係数または決定係数です。Rsquared には 2 つのフィールドがあります。

Ordinary決定係数値。構造体のスカラー値として格納されます。Rsquared.Ordinary = 1 – SSE./SST
Adjusted

固定効果係数の数に対する自由度調整済み決定係数値。構造体のスカラー値として格納されます。

Rsquared.Adjusted = 1 – (SSE./SST)*(DFT./DFE)

ここで DFE = n – p および DFT = n – 1 です。n は観測値の総数、p は固定効果係数の数です。

データ型: 構造体

誤差二乗和、つまり二乗した条件付き残差の和。正のスカラー値として格納されます。

SSE = sum((y – F).^2)。ここで y は応答ベクトルで、F は線形混合効果モデルの近似条件付き応答です。条件付きモデルには、固定効果と変量効果の両方からの寄与が含まれます。

データ型: double

回帰二乗和、つまり線形混合効果回帰で説明される二乗和。正のスカラー値として格納されます。これは条件付き近似値を平均した偏差の二乗和です。

SSR = sum((F – mean(F)).^2)。ここで F は線形混合効果モデルの近似条件付き応答です。条件付きモデルには、固定効果と変量効果の両方からの寄与が含まれます。

データ型: double

二乗総和、つまり観察された応答値のその平均からの偏差の二乗和。正のスカラー値として格納されます。

SST = sum((y – mean(y)).^2) = SSR + SSE です。y は応答ベクトルです。

データ型: double

変数。テーブルとして格納します。

  • 近似がテーブルまたはデータセット配列 tbl に基づいている場合、Variablestbl と同じです。

  • 近似が行列入力に基づいている場合、Variables は予測子行列のすべての変数と応答変数が格納されたテーブルです。

データ型: テーブル

近似に使用される変数についての情報。テーブルとして格納します。

VariableInfo には、観測ごとに 1 つの変数と以下の 4 つの列があります。

Class変数のクラス ('double''cell''nominal' など)。
Range

変数の値の範囲。

  • 数値変数の場合は、[min,max] 形式の 2 要素ベクトルです。

  • セルまたはカテゴリカル変数の場合は、変数の一意の値をすべて含むセルまたは categorical 配列です。

InModel

変数が近似モデルの予測子である場合は true

変数が近似モデルに含まれていない場合は false

IsCategorical

変数の型が、セル、論理、カテゴリカルなどのカテゴリカル予測子として処理される型である場合や、変数が fit メソッドの名前と値のペア引数 'Categorical' でカテゴリカルとして指定された場合は true

変数が連続予測子である場合は false

データ型: テーブル

あてはめで使用する変数の名前。文字ベクトルの cell 配列として格納されます。

  • 標本データがテーブルまたはデータセット配列 tbl に含まれている場合、VariableNames には tbl の変数の名前が格納されます。

  • 標本データが行列形式である場合、VariableInfo にはモデルの近似中に提供した変数名が格納されます。変数名を指定しなかった場合、VariableInfo には既定の名前が格納されます。

データ型: cell

メソッド

anova線形混合効果モデルの分散分析
coefCI 線形混合効果モデルの係数の信頼区間
coefTest線形混合効果モデルの固定効果と変量効果についての仮説検定
compare線形混合効果モデルの比較
covarianceParameters線形混合効果モデルの共分散パラメーターの抽出
designMatrix固定効果と変量効果の計画行列
disp線形混合効果モデルの表示
fit(非推奨) table を使用して線形混合効果モデルをあてはめる
fitmatrix 計画行列を使用して線形混合効果モデルを近似する
fitted線形混合効果モデルからの近似応答
fixedEffects固定効果と関連する統計の推定
plotResiduals線形混合効果モデルの残差のプロット
predict 線形混合効果モデルの応答予測
random 近似線形混合効果モデルからのランダム応答の生成
randomEffects 変量効果と関連する統計の推定
residuals近似線形混合効果モデルの残差
response線形混合効果モデルの応答ベクトル

コピーのセマンティクス

値。値のクラスがコピー操作に与える影響については、オブジェクトのコピー (MATLAB)を参照してください。

すべて折りたたむ

標本データを読み込みます。

load flu

データセット配列 flu には、変数 Date と、インフルエンザ推定罹患率 (Google® 検索から推定される 9 地域の値と疾病対策センター (CDC) による全国の推定値) が格納されている 10 個の変数が含まれています。

線形混合効果モデルを近似するには、データが適切な形式のデータセット配列になっていなければなりません。インフルエンザ罹患率を応答として、地域を予測子変数として線形混合効果モデルをあてはめるため、地域に対応する 9 個の列を 1 つの配列にまとめます。新しいデータセット配列 flu2 には、応答変数 FluRate、各推定の元になっている地域を示すノミナル変数 Region およびグループ化変数 Date が含まれなければなりません。

flu2 = stack(flu,2:10,'NewDataVarName','FluRate',...
    'IndVarName','Region');
flu2.Date = nominal(flu2.Date);

地域に対する固定効果と、Date で変化するランダム切片で、線形混合効果モデルを近似します。

地域はノミナル変数であるため、fitlme は最初の地域 NE を参照として受け取り、他の 8 つの地域を表す 8 つのダミー変数を作成します。たとえば、I[MidAtl] は地域 MidAtl を表すダミー変数です。詳細については、ダミー指標変数を参照してください。

対応するモデルは以下のとおりです。

yim=β0+β1I[MidAtl]i+β2I[ENCentral]i+β3I[WNCentral]i+β4I[SAtl]i+β5I[ESCentral]i+β6I[WSCentral]i+β7I[Mtn]i+β8I[Pac]i+b0m+εim,m=1,2,...,52,

ここで、yim はグループ化変数 Date のレベル m に対する観測値 iβj は固定効果係数 (j = 0、1、...、8)、b0m はグループ化変数 Date のレベル m に対する変量効果、εim は観測値 i の観測誤差です。変量効果の事前分布は b0mN(0,σb2)、誤差項の分布は εimN(0,σ2) です。

lme = fitlme(flu2,'FluRate ~ 1 + Region + (1|Date)')
lme = 
Linear mixed-effects model fit by ML

Model information:
    Number of observations             468
    Fixed effects coefficients           9
    Random effects coefficients         52
    Covariance parameters                2

Formula:
    FluRate ~ 1 + Region + (1 | Date)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    318.71    364.35    -148.36          296.71  

Fixed effects coefficients (95% CIs):
    Name                      Estimate    SE          tStat      DF 
    '(Intercept)'               1.2233    0.096678     12.654    459
    'Region_MidAtl'           0.010192    0.052221    0.19518    459
    'Region_ENCentral'        0.051923    0.052221     0.9943    459
    'Region_WNCentral'         0.23687    0.052221     4.5359    459
    'Region_SAtl'             0.075481    0.052221     1.4454    459
    'Region_ESCentral'         0.33917    0.052221      6.495    459
    'Region_WSCentral'           0.069    0.052221     1.3213    459
    'Region_Mtn'              0.046673    0.052221    0.89377    459
    'Region_Pac'              -0.16013    0.052221    -3.0665    459


    pValue        Lower        Upper    
     1.085e-31       1.0334       1.4133
       0.84534    -0.092429      0.11281
        0.3206    -0.050698      0.15454
    7.3324e-06      0.13424      0.33949
       0.14902     -0.02714       0.1781
    2.1623e-10      0.23655      0.44179
       0.18705    -0.033621      0.17162
       0.37191    -0.055948      0.14929
     0.0022936     -0.26276    -0.057514

Random effects covariance parameters (95% CIs):
Group: Date (52 Levels)
    Name1                Name2                Type         Estimate    Lower 
    '(Intercept)'        '(Intercept)'        'std'        0.6443      0.5297


    Upper  
    0.78368

Group: Error
    Name             Estimate    Lower      Upper
    'Res Std'        0.26627     0.24878    0.285

p 値 7.3324e-06 および 2.1623e-10 は、地域 WNCentral および ESCentral のインフルエンザ罹患率の固定効果が地域 NE のインフルエンザ罹患率に対して有意に異なることをそれぞれ示しています。

変量効果項の標準偏差 σb の信頼限界 (0.5297, 0.78368) には、変量効果項が有意であることを示す 0 が含まれていません。compare メソッドを使用して、変量効果の項の有意性をテストすることもできます。

観測値の推定値は、その観測値に対応するグループ化変数レベルの固定効果および変量効果の値の合計です。たとえば、2005 年 10 月 9 日の週における地域 WNCentral の罹患率に対する最良線形不偏予測量 (BLUP) の推定値は次のようになります。

yˆWNCentral,10/9/2005=βˆ0+βˆ3I[WNCentral]+bˆ10/9/2005=1.2233+0.23687-0.1718=1.28837.

固定効果と変量効果の両方による推定に対する寄与が含まれているので、これは近似された条件付き応答です。この値を以下のように計算することもできます。

beta = fixedEffects(lme);
[~,~,STATS] = randomEffects(lme); % Compute the random-effects statistics (STATS)
STATS.Level = nominal(STATS.Level);
y_hat = beta(1) + beta(4) + STATS.Estimate(STATS.Level=='10/9/2005')
y_hat = 1.2884

fitted メソッドを使用して、近似値を簡単に表示できます。

F = fitted(lme);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')
ans = 1.2884

2005 年 10 月 9 日の週における地域 WNCentral の近似限界応答を計算します。

F = fitted(lme,'Conditional',false);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')
ans = 1.4602

標本データを読み込みます。

load carbig

ガロンあたりの走行マイル数 (MPG) の線形混合効果モデルを近似します。ここで、加速度、馬力、気筒数は固定効果で、モデル年度によってグループ化される切片と加速度は無相関の変量効果です。このモデルは以下に対応します。

MPGim=β0+β1Acci+β2HP+b0m+b1mAccim+εim,m=1,2,3,

変量効果項の事前分布は次のようになります。

bm=(b0mb1m)N(0,(σ02σ0,1σ0,1σ12)),

ここで、m はモデル年を表します。

最初に、線形混合効果モデルを近似するための計画行列を準備します。

X = [ones(406,1) Acceleration Horsepower];
Z = [ones(406,1) Acceleration];
Model_Year = nominal(Model_Year);
G = Model_Year;

次に、定義した計画行列とグループ化変数で fitlmematrix を使用してモデルを近似します。'fminunc' 最適化アルゴリズムを使用します。

lme = fitlmematrix(X,MPG,Z,G,'FixedEffectPredictors',....
{'Intercept','Acceleration','Horsepower'},'RandomEffectPredictors',...
{{'Intercept','Acceleration'}},'RandomEffectGroups',{'Model_Year'},...
'FitMethod','REML')
lme = 
Linear mixed-effects model fit by REML

Model information:
    Number of observations             392
    Fixed effects coefficients           3
    Random effects coefficients         26
    Covariance parameters                4

Formula:
    Linear Mixed Formula with 4 predictors.

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    2202.9    2230.7    -1094.5          2188.9  

Fixed effects coefficients (95% CIs):
    Name                  Estimate    SE           tStat      DF     pValue    
    'Intercept'             50.064       2.3176     21.602    389    1.4185e-68
    'Acceleration'        -0.57897      0.13843    -4.1825    389    3.5654e-05
    'Horsepower'          -0.16958    0.0073242    -23.153    389    3.5289e-75


    Lower       Upper   
      45.507       54.62
    -0.85112    -0.30681
    -0.18398    -0.15518

Random effects covariance parameters (95% CIs):
Group: Model_Year (13 Levels)
    Name1                 Name2                 Type          Estimate
    'Intercept'           'Intercept'           'std'            3.72 
    'Acceleration'        'Intercept'           'corr'        -0.8769 
    'Acceleration'        'Acceleration'        'std'          0.3593 


    Lower       Upper   
      1.5215      9.0954
    -0.98274    -0.33846
     0.19418     0.66483

Group: Error
    Name             Estimate    Lower     Upper 
    'Res Std'        3.6913      3.4331    3.9688

固定効果係数の表示には、推定値、標準誤差 (SE) および 95% 信頼区間の限界 (Lower および Upper) が含まれます。p 値 (pValue) は、3 つの固定効果係数がすべて有意であることを示しています。

標準偏差の信頼区間と、切片に対する変量効果と加速度の間の相関には 0 は含まれていません。そのため、これらは有意と考えられます。変量効果を検定するには、compare メソッドを使用します。

推定固定効果係数の共分散行列を表示します。

lme.CoefficientCovariance
ans = 3×3

    5.3711   -0.2809   -0.0126
   -0.2809    0.0192    0.0005
   -0.0126    0.0005    0.0001

対角要素は、固定効果係数の推定値の分散を示しています。たとえば、切片の推定値の分散は 5.3711 です。推定値の標準誤差は分散の平方根です。たとえば、切片の標準誤差は 2.3176 (sqrt(5.3711)) です。

非対角要素は、固定効果係数の推定値間の相関を示しています。たとえば、切片と加速度間の相関は –0.2809 で、加速度と馬力間の相関は 0.0005 です。

モデルの決定係数を表示します。

lme.Rsquared
ans = struct with fields:
    Ordinary: 0.7826
    Adjusted: 0.7815

調整値は、モデルの予測子の数に対する自由度調整済み決定係数値です。

詳細

すべて展開する