compare

線形混合効果モデルの比較

構文

results = compare(lme,altlme)

results = compare(___,Name,Value)

[results,siminfo] = compare(lme,altlme,'NSim',nsim)

[results,siminfo] = compare(___,Name,Value)

説明

results = compare(lme,altlme) は、線形混合効果モデル lme と altlme を比較する尤度比検定の結果を返します。どちらのモデルも近似で同じ応答ベクトルを使用しなければならず、理論的尤度比検定を有効にするためには lme を altlme の入れ子にしなければなりません。常に、小さい方のモデルを最初に入力し、次に大きい方のモデルを入力します。

compare は次の帰無仮説と対立仮説を検定します。

H₀:観測した応答ベクトルは lme によって生成された。

H₁:観測した応答ベクトルは altlme モデルによって生成された。

モデルの比較に先立ち、ML (最尤) 法を使用して lme と altlme を当てはめることをお勧めします。REML (制限付き最尤) 法を使用する場合は、両方のモデルに含まれる固定効果の計画行列を同じにしなければなりません。

固定効果を検定するには、lme と altlme を ML で当てはめてるか、シミュレーションされた尤度比検定で compare を使用するか、fixedEffects、anova または coefTest メソッドを使用します。

results = compare(___,Name,Value) も、線形混合効果モデル lme と altlme を比較する尤度比検定の結果を返しますが、1 つ以上の Name,Value ペア引数で指定する追加オプションがあります。

たとえば、最初の入力モデルが 2 番目の入力モデルに入れ子になっているかどうかを調べることができます。

例

[results,siminfo] = compare(lme,altlme,'NSim',nsim) は、線形混合効果モデル lme と altlme を比較するシミュレーションされた尤度比検定の結果を返します。

lme と altlme は ML または REML を使用して当てはめることができます。また、lme を altlme の入れ子にする必要はありません。REML (制限付き最尤) 法を使用してモデルを当てはめる場合は、両方のモデルが同じ固定効果計画行列をもっていなければなりません。

例

[results,siminfo] = compare(___,Name,Value) も、線形混合効果モデル lme と altlme を比較するシミュレーションされた尤度比検定の結果を返しますが、1 つ以上の Name,Value ペア引数で指定する追加オプションがあります。

たとえば、シミュレーションされた尤度比検定の実行に関するオプションを変更したり、p 値の信頼区間の信頼水準を変更したりできます。

例

すべて折りたたむ

変量効果の検定

ライブスクリプトを開く

標本データを読み込み、table の形式に変換します。

load flu
flu = dataset2table(flu)

flu=52×11 table
         Date          NE      MidAtl    ENCentral    WNCentral    SAtl     ESCentral    WSCentral     Mtn      Pac     WtdILI
    ______________    _____    ______    _________    _________    _____    _________    _________    _____    _____    ______

    {'10/9/2005' }     0.97    1.025       1.232        1.286      1.082      1.457          1.1      0.981    0.971    1.182 
    {'10/16/2005'}    1.136     1.06       1.228        1.286      1.146      1.644        1.123      0.976    0.917     1.22 
    {'10/23/2005'}    1.135    1.172       1.278        1.536      1.274      1.556        1.236      1.102    0.895     1.31 
    {'10/30/2005'}     1.52    1.489       1.576        1.794       1.59      2.252        1.612      1.321    1.082    1.343 
    {'11/6/2005' }    1.365    1.394        1.53        1.825       1.62      2.059        1.471      1.453    1.118    1.586 
    {'11/13/2005'}     1.39    1.477       1.506          1.9      1.683      1.813        1.464      1.388    1.204     1.47 
    {'11/20/2005'}    1.212    1.231       1.295        1.495      1.347      1.794        1.303      1.371    1.137    1.611 
    {'11/27/2005'}    1.477    1.546       1.557        1.855      1.678      2.159        1.739      1.628    1.443    1.827 
    {'12/4/2005' }    1.285     1.43       1.482        1.635      1.577      1.903         1.53      1.701    1.516    1.776 
    {'12/11/2005'}    1.354     1.45        1.46        1.794      1.583      1.894        1.831      2.364    2.094    1.941 
    {'12/18/2005'}    1.502    1.622       1.638        1.988      1.947       2.22        2.577       3.89     2.66     2.34 
    {'12/25/2005'}     1.86    1.915       1.955         2.38      2.343      3.027        3.219      4.862    2.595    3.086 
    {'1/1/2006'  }    2.114    2.174       2.065        2.557      2.275      2.498        2.644      3.352    2.181     3.26 
    {'1/8/2006'  }    1.815    1.932       1.822        2.046      1.969      1.805        2.189      2.132    1.717    2.613 
    {'1/15/2006' }    1.541    1.695       1.581        2.008      1.718      1.662        2.156      1.694    1.351    2.247 
    {'1/22/2006' }    1.632    1.758       1.711        2.217      1.866      2.194        2.268      1.826    1.384    2.352 
      ⋮

table flu には、変数 Date と、インフルエンザ推定罹患率 (Google® 検索から推定される 9 地域の値と CDC による全国の推定値) が格納されている 10 個の変数が含まれています。

線形混合効果モデルを当てはめるには、データが適切な形式の table になっていなければなりません。インフルエンザ罹患率を応答として、地域を予測子変数として線形混合効果モデルを当てはめるため、地域に対応する 9 個の列を 1 つの配列にまとめます。新しい table flu2 には、応答変数 FluRate、各推定の元になっている地域を示すノミナル変数 Region、およびグループ化変数 Date が含まれなければなりません。

flu2 = stack(flu,2:10,NewDataVariableName="FluRate",...
    IndexVariableName="Region");
flu2.Date = nominal(flu2.Date);

地域ごとに切片と傾きを変化させ、Date でグループ化して、線形混合効果モデルを当てはめます。

altlme = fitlme(flu2,"FluRate ~ 1 + Region + (1 + Region|Date)");

地域に対する固定効果と、Date で変化するランダム切片で、線形混合効果モデルを当てはめます。

lme = fitlme(flu2,"FluRate ~ 1 + Region + (1|Date)");

2 つのモデルを比較します。また、lme2 が lme の入れ子になっているかどうかを調べます。

compare(lme,altlme,CheckNesting=true)

ans = 
    Theoretical Likelihood Ratio Test

    Model     DF    AIC        BIC        LogLik     LRStat    deltaDF    pValue
    lme       11     318.71     364.35    -148.36                               
    altlme    55    -305.51    -77.346     207.76    712.22    44         0

0 という小さい $p$ 値は、モデル altlme が単純なモデル lme より有意に優れていることを示します。

固定効果と変量効果の検定

ライブスクリプトを開く

標本データを読み込んで表示します。

load fertilizer.mat;
tbl

tbl=60×4 table
      Soil          Tomato       Fertilizer    Yield
    _________    ____________    __________    _____

    {'Sandy'}    {'Plum'    }        1          104 
    {'Sandy'}    {'Plum'    }        2          136 
    {'Sandy'}    {'Plum'    }        3          158 
    {'Sandy'}    {'Plum'    }        4          174 
    {'Sandy'}    {'Cherry'  }        1           57 
    {'Sandy'}    {'Cherry'  }        2           86 
    {'Sandy'}    {'Cherry'  }        3           89 
    {'Sandy'}    {'Cherry'  }        4           98 
    {'Sandy'}    {'Heirloom'}        1           65 
    {'Sandy'}    {'Heirloom'}        2           62 
    {'Sandy'}    {'Heirloom'}        3          113 
    {'Sandy'}    {'Heirloom'}        4           84 
    {'Sandy'}    {'Grape'   }        1           54 
    {'Sandy'}    {'Grape'   }        2           86 
    {'Sandy'}    {'Grape'   }        3           89 
    {'Sandy'}    {'Grape'   }        4          115 
      ⋮

table tbl には土壌の種類に基づいて土壌が 3 つのブロックに分けられている分割プロット試験のデータが含まれています。土壌の種類は砂質、シルト、および粘土質です。各ブロックは 5 つのプロットに分割され、5 種類のトマトの苗木 (チェリー、エアルーム、グレープ、枝付き、プラム) がランダムにこれらのプロットに割り当てられます。その後、プロット内のトマトの苗木はサブプロットに分割され、それぞれのサブプロットが 4 つの肥料の中の 1 つにより処置されます。このデータは、シミュレーションされたものです。

Tomato、Soil、および Fertilizer をカテゴリカル変数に変換します。

tbl.Tomato = nominal(tbl.Tomato);
tbl.Soil = nominal(tbl.Soil);
tbl.Fertilizer = nominal(tbl.Fertilizer);

線形混合効果モデルを当てはめます。Fertilizer および Tomato は固定効果変数であり、平均収穫量はブロック (土壌の種類) とブロック内のプロット (土壌の種類の中のトマトの種類) によって独立して変化します。

lmeBig = fitlme(tbl,"Yield ~ Fertilizer * Tomato + (1|Soil) + (1|Soil:Tomato)");

交互作用項 Tomato:Fertilizer および変量効果の項 (1 | Soil) を削除した後、モデルを再度当てはめます。

lmeSmall = fitlme(tbl,"Yield ~ Fertilizer + Tomato + (1|Soil:Tomato)");

シミュレーションされた尤度比検定を 1000 反復で使用して 2 つのモデルを比較します。この検定を使用して、固定効果の項と変量効果の項の両方を検定しなければなりません。既定の近似法 ML を使用して両方のモデルを当てはめることに注意してください。このため、固定効果計画行列に対して制限はありません。REML (制限付き最尤) 法を使用する場合は、両方のモデルが同じ固定効果計画行列をもっていなければなりません。

[table,siminfo] = compare(lmeSmall,lmeBig,nsim=1000)

table = 
    Simulated Likelihood Ratio Test: Nsim = 1000, Alpha = 0.05

    Model       DF    AIC       BIC       LogLik     LRStat    pValue     Lower      Upper  
    lmeSmall    10    511.06       532    -245.53                                           
    lmeBig      23    522.57    570.74    -238.29    14.491    0.57343    0.54211    0.60431

siminfo = struct with fields:
           nsim: 1000
          alpha: 0.0500
      pvalueSim: 0.5734
    pvalueSimCI: [0.5421 0.6043]
        deltaDF: 13
            TH0: [1000×1 double]

大きい $p$ 値は、大きいモデル lme が小さいモデル lme2 より有意には優れていないことを示します。lme2 の方が赤池およびベイズ情報量基準の値が小さいこともこれを裏付けています。

相関および無相関の変量効果のモデル

スクリプトを開く

標本データを読み込みます。

load carbig

ガロンあたりの走行マイル数 (MPG) の線形混合効果モデルを当てはめます。この近似では、加速度、馬力、気筒数に対する固定効果と、モデル年度によってグループ化される切片と加速度に対する、相関された可能性がある変量効果を使用します。

最初に、計画行列を準備します。

X = [ones(406,1) Acceleration Horsepower];
Z = [ones(406,1) Acceleration];
Model_Year = nominal(Model_Year);
G = Model_Year;

次に、定義した計画行列とグループ化変数で fitlmematrix を使用してモデルを当てはめます。

lme = fitlmematrix(X,MPG,Z,G,'FixedEffectPredictors',....
{'Intercept','Acceleration','Horsepower'},'RandomEffectPredictors',...
{{'Intercept','Acceleration'}},'RandomEffectGroups',{'Model_Year'});

切片と加速度について無相関の変量効果でモデルを再度当てはめます。最初に、変量効果計画と変量効果グループ化変数を準備します。

Z = {ones(406,1),Acceleration};
G = {Model_Year,Model_Year};

lme2 = fitlmematrix(X,MPG,Z,G,'FixedEffectPredictors',....
{'Intercept','Acceleration','Horsepower'},'RandomEffectPredictors',...
{{'Intercept'},{'Acceleration'}},'RandomEffectGroups',...
{'Model_Year','Model_Year'});

シミュレーションされた尤度比検定を使用して lme と lme2 を比較します。

compare(lme2,lme,'CheckNesting',true,'NSim',1000)

ans = 


    SIMULATED LIKELIHOOD RATIO TEST: NSIM = 1000, ALPHA = 0.05

    Model    DF    AIC       BIC       LogLik     LRStat    pValue      Lower   
    lme2     6     2194.5    2218.3    -1091.3                                  
    lme      7     2193.5    2221.3    -1089.7    3.0323    0.095904    0.078373


    Upper  
           
    0.11585

大きい $p$ 値は、lme2 が lme より有意に優れた当てはめではないことを示します。

並列計算を使用するシミュレーションされた尤度比検定

この例では次を使用します。

ライブスクリプトを開く

標本データを読み込んで表示します。

load fertilizer.mat
tbl

tbl=60×4 table
      Soil          Tomato       Fertilizer    Yield
    _________    ____________    __________    _____

    {'Sandy'}    {'Plum'    }        1          104 
    {'Sandy'}    {'Plum'    }        2          136 
    {'Sandy'}    {'Plum'    }        3          158 
    {'Sandy'}    {'Plum'    }        4          174 
    {'Sandy'}    {'Cherry'  }        1           57 
    {'Sandy'}    {'Cherry'  }        2           86 
    {'Sandy'}    {'Cherry'  }        3           89 
    {'Sandy'}    {'Cherry'  }        4           98 
    {'Sandy'}    {'Heirloom'}        1           65 
    {'Sandy'}    {'Heirloom'}        2           62 
    {'Sandy'}    {'Heirloom'}        3          113 
    {'Sandy'}    {'Heirloom'}        4           84 
    {'Sandy'}    {'Grape'   }        1           54 
    {'Sandy'}    {'Grape'   }        2           86 
    {'Sandy'}    {'Grape'   }        3           89 
    {'Sandy'}    {'Grape'   }        4          115 
      ⋮

Tomato、Soil、および Fertilizer をカテゴリカル変数に変換します。

tbl.Tomato = categorical(tbl.Tomato);
tbl.Soil = categorical(tbl.Soil);
tbl.Fertilizer = categorical(tbl.Fertilizer);

lme = fitlme(tbl,"Yield ~ Fertilizer * Tomato + (1|Soil) + (1|Soil:Tomato)");

交互作用項 Tomato:Fertilizer および変量効果の項 (1|Soil) を削除した後、モデルを再度当てはめます。

lme2 = fitlme(tbl,"Yield ~ Fertilizer + Tomato + (1|Soil:Tomato)");

LinearMixedModel のオプション構造体を作成します。

opt = statset("LinearMixedModel")

opt = struct with fields:
          Display: 'off'
      MaxFunEvals: []
          MaxIter: 10000
           TolBnd: []
           TolFun: 1.0000e-06
       TolTypeFun: []
             TolX: 1.0000e-12
         TolTypeX: []
          GradObj: []
         Jacobian: []
        DerivStep: []
      FunValCheck: []
           Robust: []
     RobustWgtFun: []
           WgtFun: []
             Tune: []
      UseParallel: []
    UseSubstreams: []
          Streams: {}
        OutputFcn: []

並列検定用に options を変更します。

opt.UseParallel = true;

並列環境を開始します。

mypool = parpool();

Starting parallel pool (parpool) using the 'Processes' profile ...
13-Nov-2024 10:18:44: Job Queued. Waiting for parallel pool job with ID 4 to start ...
Connected to parallel pool with 4 workers.

反復数 1000 の並列計算でシミュレーションされた尤度比検定を使用し、lme2 と lme を比較します。

compare(lme2,lme,nsim=1000,Options=opt)

ans = 
    Simulated Likelihood Ratio Test: Nsim = 1000, Alpha = 0.05

    Model    DF    AIC       BIC       LogLik     LRStat    pValue     Lower    Upper  
    lme2     10    511.06       532    -245.53                                         
    lme      23    522.57    570.74    -238.29    14.491    0.52747    0.496    0.55878

大きい $p$ 値は、大きいモデル lme が小さいモデル lme2 より有意には優れていないことを示します。lme2 に対する AIC と BIC の値が小さいこともこれを裏付けています。

入力引数

すべて折りたたむ

`lme` — 線形混合効果モデル
`LinearMixedModel` オブジェクト

線形混合効果モデル。fitlme または fitlmematrix を使用して構築した LinearMixedModel オブジェクトとして指定します。

`altlme` — 代替線形混合効果モデル
`LinearMixedModel` オブジェクト

同じ応答ベクトルに異なるモデル仕様によって当てはめる代替線形混合効果モデル。LinearMixedModel オブジェクトとして指定されます。lme は altlme で入れ子にされている必要があります。つまり、一部のパラメーターを 0 などの固定値に設定することにより lme を altlme から取得する必要があります。線形混合効果オブジェクトは、fitlme または fitlmematrix を使用して作成できます。

`nsim` — シミュレーションの反復数
正の整数

シミュレーションされた尤度比検定でのシミュレーションの反復数。正の整数値として指定します。シミュレーションされた尤度比検定を実行するには nsim を指定しなければなりません。

例: 'NSim',1000

データ型: double | single

名前と値の引数

すべて折りたたむ

オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで、Name は引数名で、Value は対応する値です。名前と値の引数は他の引数の後に指定しなければなりませんが、ペアの順序は重要ではありません。

R2021a より前では、名前と値をそれぞれコンマを使って区切り、Name を引用符で囲みます。

例: results = compare(lme,altlme,'CheckNesting',true)

`Alpha` — 有意水準
0.05 (既定値) | 0 ～ 1 の範囲のスカラー値

有意水準。'Alpha' と 0 ～ 1 の範囲にあるスカラー値から構成されるコンマ区切りのペアとして指定します。値が α の場合、信頼水準は 100 × (1 – α)% です。

たとえば、99% の信頼区間の場合は、次のように信頼水準を指定できます。

例: 'Alpha',0.01

データ型: single | double

`Options` — シミュレーションされた尤度比検定を実行するためのオプション
構造体

シミュレーションされた尤度比検定を並列実行するためのオプション。'Options' と、statset('LinearMixedModel') によって作成される構造体から構成されるコンマ区切りのペアとして指定します。

これらのオプションには Parallel Computing Toolbox™ が必要です。

compare は次のフィールドを使用します。

`'UseParallel'`	逐次計算の場合は `False`。既定の設定。並列計算の場合は `True`。並列計算には Parallel Computing Toolbox が必要です。
`'UseSubstreams'`	各反復に対して乱数発生器の個別のサブストリームを使用しない場合は `False`。既定の設定。各反復に対して乱数発生器の個別のサブストリームを使用する場合は `True`。このオプションは、サブストリームをサポートする乱数ストリームタイプでのみ使用できます。
`'Streams'`	`'UseSubstreams'` が `True` の場合、`'Streams'` は単一の乱数ストリームであるか、単一のストリームを含むスカラー cell 配列でなければなりません。 `'UseSubstreams'` が `False` の場合は、次のようになります。 `'UseParallel'` が `False` の場合は、`'Streams'` は単一の乱数ストリームであるか、単一のストリームを含むスカラー cell 配列でなければなりません。 `'UseParallel'` が `True` の場合、`'Streams'` は使用されるプロセッサ数と等しくなければなりません。並列プールが開いている場合、`'Streams'` は並列プールのサイズと同じ長さです。`'UseParallel'` が `True` の場合、並列プールは自動的に開いている可能性があります。ただし、`'Streams'` を使用されるプロセッサの数と等しくしなければならないので、`parpool` コマンドを使用してプールを明示的に開き、次に `'UseParallel','True'` オプションを指定して `compare` を呼び出すのが最善の方法です。

コマンドラインでの並列統計計算の詳細を表示するには、次のように入力します。

help parallelstats

データ型: struct

`CheckNesting` — 2 つのモデルの間の入れ子を調べるためのインジケーター
`false` (既定値) | `true`

2 つのモデルの間の入れ子を確認するためのインジケーター。'CheckNesting' と以下のいずれかで構成されるコンマ区切りのペアとして指定します。

`false`	既定の設定。確認しません。
`true`	`compare` は、小さい方のモデル `lme` が大きい方のモデル `altlme` に入れ子になっているかどうかを確認します。

理論的尤度比検定を有効にするためには、lme を代替モデル altlme で入れ子にしなければなりません。入れ子要件が満たされていない場合、compare はエラーメッセージを返します。

どちらの検定に対しても有効ですが、シミュレーションされた尤度比検定の方が入れ子の要件は弱くなります。

例: 'CheckNesting',true

データ型: single | double

出力引数

すべて折りたたむ

`results` — 尤度比検定またはシミュレーションされた尤度比検定の結果
データセット配列

尤度比検定またはシミュレーションされた尤度比検定の結果。2 行のデータセット配列として返します。1 行目は lme に対応し、2 行目は altlme に対応しています。results の列は、検定が尤度比検定かシミュレーションされた尤度比検定かに依存します。

尤度比検定を使用している場合は、results に以下の列が含まれます。

`Model`	モデルの名前
`DF`	自由度、つまりモデル内の自由パラメーターの数
`AIC`	モデルの赤池情報量基準
`BIC`	モデルのベイズ情報量基準
`LogLik`	モデルの最大化された対数尤度
`LRStat`	`altlme` と `lme` を比較するための尤度比検定統計
`deltaDF`	`altlme` の `DF` から `lme` の `DF` を引いた値
`pValue`	尤度比検定の p 値

シミュレーションされた尤度比検定を使用している場合は、results に以下の列が含まれます。

`Model`	モデルの名前
`DF`	自由度、つまりモデル内の自由パラメーターの数
`LogLik`	モデルの最大化された対数尤度
`LRStat`	`altlme` と `lme` を比較するための尤度比検定統計
`pValue`	尤度比検定の p 値
`Lower`	`pValue` の信頼区間の下限
`Upper`	`pValue` の信頼区間の上限

`siminfo` — シミュレーション出力
構造体

シミュレーション出力。以下のフィールドを含む構造体として返します。

`nsim`	`nsim` の値セット。
`alpha`	`'Alpha'` の値セット。
`pValueSim`	シミュレーションベースの p 値。
`pValueSimCI`	`pValueSim` の信頼区間。ベクトルの最初の要素は下限であり、ベクトルの 2 番目の要素は上限です。
`deltaDF`	`altlme` の自由パラメーターの数から `lme` の自由パラメーターの数を引いた値。`altlme` の `DF` から `lme` の `DF` を引いた値。
`THO`	モデル `lme` によって観測済みの応答ベクトル `y` が生成されたという帰無仮説の下でシミュレーションされた尤度比検定統計のベクトル。

詳細

すべて折りたたむ

尤度比検定

帰無仮説 H₀ の場合、観測される尤度比検定統計は、自由度が deltaDF の近似カイ二乗参照分布になります。2 つのモデルを比較するとき、compare は、観測される尤度比検定統計とこのカイ二乗参照分布を比較して、尤度比検定の p 値を計算します。

尤度比検定を使用して取得される p 値は、変量効果の項の有無について検定する場合は保守的になり、固定効果の項の有無について検定する場合は保守的でなくなる可能性もあります。したがって、固定効果の検定のときは、fixedEffects、anova または coefTest メソッドか、シミュレーションされた尤度比検定を使用します。

シミュレーションされた尤度比検定

シミュレーションされた尤度比検定を実行するため、compare は最初に帰無仮説での尤度比検定統計の参照分布を生成します。次に、この参照分布を観測された尤度比検定統計と比較することで、代替モデルの統計的な有意性を評価します。

compare は、次のようにして、帰無仮説での尤度比検定統計のシミュレーションされた参照分布を生成します。

当てはめられたモデル lme から乱数データ ysim を生成します。
lme および代替モデル altlme で指定されているモデルをシミュレーションされたデータ ysim に当てはめます。
手順 2 の結果を使用して尤度比検定統計を計算し、値を格納します。
手順 1 から 3 を nsim 回繰り返します。

次に、compare は、観測された尤度比検定統計とシミュレーションされた参照分布を比較して、シミュレーションされた尤度比検定の p 値を計算します。p 値の推定は、シミュレーションされた尤度比検定統計が観測された値プラス 1 以上である回数と、反復回数プラス 1 の比です。

観測された尤度比検定統計が T で、シミュレーションされた参照分布がベクトル T_H₀ に格納されているとします。このとき次のようになります。

$p - v a l u e = \frac{[\sum_{j = 1}^{n s i m} I (T_{H_{0}} (j) \geq T)] + 1}{n s i m + 1} .$

シミュレーションされた参照分布の不確実性を考慮するため、compare は true の p 値の 100*(1 – α)% 信頼区間を計算します。

シミュレーションされた尤度比検定を使用して、任意の線形混合効果モデルを比較できます。つまり、シミュレーションされた尤度比検定を使用する場合は、lme を altlme 内に入れ子にする必要はなく、ML (最尤) 法または REML (制限付き最尤) 法を使用して lme および altlme を当てはめることができます。REML (制限付き最尤) 法を使用してモデルを当てはめる場合は、両方のモデルが同じ固定効果計画行列をもっていなければなりません。

入れ子要件

'CheckNesting','True' 名前と値のペアの引数は、以下の要件を確認します。

シミュレーションされた尤度比検定の場合:

同じ方法を使用して両方のモデル (lme と altlme) を当てはめなければなりません。compare では、ML を使用するモデル近似と REML を使用するモデル近似を比較することはできません。
両方のモデルを同じ応答ベクトルに当てはめなければなりません。
REML を使用して lme と altlme を当てはめる場合は、両方のモデルが同じ固定効果計画行列をもっていなければなりません。
大きい方のモデル (altlme) の最大化された対数尤度または制限付き対数尤度は、小さい方のモデル (lme) の最大化された対数尤度または制限付き対数尤度より大きいか等しくなければなりません。

理論的検定の場合、'CheckNesting','True' はシミュレーションされた尤度比検定の要件と以下の要件をすべて確認します。

lme および altlme の当てはめに使用する重みベクトルは、同一でなければなりません。
ML を使用して lme と altlme を当てはめる場合、大きいモデル (altlme) の固定効果の計画行列には、小さいモデル (lme) の固定効果の計画行列が含まれていなければなりません。
大きいモデル (altlme) の変量効果の計画行列には、小さいモデル (lme) の変量効果の計画行列が含まれていなければなりません。

赤池およびベイズ情報量基準

AIC (赤池情報量基準) は、AIC = –2*logL_M + 2*(nc + p + 1) です。logL_M はモデルの最大化された対数尤度 (または最大化された制限付き対数尤度) であり、nc + p + 1 はモデルで推定されるパラメーターの数です。p は固定効果係数の数であり、nc は残差分散を除く変量効果の共分散のパラメーターの総数です。

ベイズ情報量基準 (BIC) は、BIC = –2*logL_M + ln(n_eff)*(nc + p + 1) です。logL_M はモデルの最大化された対数尤度 (つまり最大化された制限付き対数尤度)、n_eff は有効な観測値数、(nc + p + 1) はモデルで推定されているパラメーターの数です。

近似法が最尤 (ML) 法の場合は n_eff = n で、n は観測の数です。
近似法が制限付き最尤 (REML) 法の場合は n_eff = n-p です。

逸脱度の値が小さいほど、近似が優れていることを意味します。逸脱度の値が小さくなると、AIC および BIC も小さくなる傾向があります。AIC と BIC のどちらにも、推定されるパラメーターの数 p に基づくペナルティ項が含まれます。したがって、パラメーターの数が増えると、AIC および BIC の値も大きくなる傾向があります。異なるモデルを比較するときは、AIC または BIC の値が最も小さいモデルが最良近似のモデルと考えられます。

逸脱度

LinearMixedModel は、モデル M の逸脱度を、そのモデルの対数尤度のマイナス 2 倍として計算します。L_M がモデル M の尤度関数の最大値を示しているものとします。この場合、モデル M の逸脱度は次のようになります。

$- 2 * \log L_{M} .$

逸脱度の値が小さいほど、近似が優れていることを意味します。M₁ と M₂ は 2 つの異なるモデルであり、M₁ は M₂ に入れ子になっているものとします。この場合、モデルの当てはめはこれらのモデルの逸脱度 Dev₁ と Dev₂ を比較することによって評価できます。逸脱度の差異は以下のとおりです。

$D e v = D e v_{1} - D e v_{2} = 2 (\log L M_{2} - \log L M_{1}) .$

通常、この差異の漸近分布はカイ二乗分布であり、その自由度 v は、1 つのモデルで推定され、他のモデルでは固定されている (通常は 0) パラメーターの数に等しくなります。つまり、M₁ と M₂ で推定されるパラメーターの数の差異と等しくなります。この検定の p 値は 1 – chi2cdf(Dev,V) を使用して得ることができます。ここで、Dev = Dev₂ - Dev₁ です。

ただし、混合効果モデルでは、一部の分散成分がパラメーター空間の境界上になると、この差異の漸近分布はさらに複雑になります。たとえば、次の仮説について考えます。

H₀: $D = (\begin{matrix} D_{11} & 0 \\ 0 & 0 \end{matrix}),$ とした場合、D は q 行 q 列の対称な半正定値行列である。

H₁: D は、(q+1) 行 (q+1) 列の対称な半正定値行列です。

つまり、H₁ は、D の最後の行と列がゼロとは異なることを記述します。ここで、大きい方のモデル M₂ には q + 1 個のパラメーターがあり、小さい方のモデル M₁ には q 個のパラメーターがあります。また、Dev では、χ²_q 分布と χ²_{(q + 1)} 分布が 50:50 で混合されています (Stram and Lee、1994)。

参照

[1] Hox, J. Multilevel Analysis, Techniques and Applications. Lawrence Erlbaum Associates, Inc., 2002.

[2] Stram D. O. and J. W. Lee. “Variance components testing in the longitudinal mixed-effects model”. Biometrics, Vol. 50, 4, 1994, pp. 1171–1177.

拡張機能

すべて展開する

自動並列サポート
Parallel Computing Toolbox™ を使用して自動的に並列計算を実行することで、コードを高速化します。

並列実行するには、この関数を呼び出すときに名前と値の引数 Options を指定し、statset を使用してオプション構造体の UseParallel フィールドを true に設定します。

Options=statset(UseParallel=true)

並列計算の詳細については、自動並列サポートを使用した MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2013b で導入

参考

compare

構文

説明

例

変量効果の検定

固定効果と変量効果の検定

相関および無相関の変量効果のモデル

並列計算を使用するシミュレーションされた尤度比検定

入力引数

lme — 線形混合効果モデル LinearMixedModel オブジェクト

altlme — 代替線形混合効果モデル LinearMixedModel オブジェクト

nsim — シミュレーションの反復数 正の整数

名前と値の引数

Alpha — 有意水準 0.05 (既定値) | 0 ～ 1 の範囲のスカラー値

Options — シミュレーションされた尤度比検定を実行するためのオプション 構造体

CheckNesting — 2 つのモデルの間の入れ子を調べるためのインジケーター false (既定値) | true

出力引数

results — 尤度比検定またはシミュレーションされた尤度比検定の結果 データセット配列

siminfo — シミュレーション出力 構造体

詳細

尤度比検定

シミュレーションされた尤度比検定

入れ子要件

赤池およびベイズ情報量基準

逸脱度

参照

拡張機能

自動並列サポート Parallel Computing Toolbox™ を使用して自動的に並列計算を実行することで、コードを高速化します。

バージョン履歴

参考

`lme` — 線形混合効果モデル
`LinearMixedModel` オブジェクト

`altlme` — 代替線形混合効果モデル
`LinearMixedModel` オブジェクト

`nsim` — シミュレーションの反復数
正の整数

`Alpha` — 有意水準
0.05 (既定値) | 0 ～ 1 の範囲のスカラー値

`Options` — シミュレーションされた尤度比検定を実行するためのオプション
構造体

`CheckNesting` — 2 つのモデルの間の入れ子を調べるためのインジケーター
`false` (既定値) | `true`

`results` — 尤度比検定またはシミュレーションされた尤度比検定の結果
データセット配列

`siminfo` — シミュレーション出力
構造体

自動並列サポート
Parallel Computing Toolbox™ を使用して自動的に並列計算を実行することで、コードを高速化します。