Main Content

式と計画行列の関係

一般に、モデル仕様の式は 'y ~ terms' という形式の文字ベクトルまたは string スカラーです。線形混合効果モデルでは、この式は 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' の形式になります。ここで、fixed および random には固定効果および変量効果の項が含まれます。

テーブル tbl に以下のものが格納されていると仮定します。

  • 応答変数 y

  • 連続変数またはグループ化変数である予測子変数 Xj

  • グループ化変数 g1g2、...、gR

ここで、Xj および gr のグループ化変数は、categorical 配列、logical 配列、文字配列、string 配列、または文字ベクトルの cell 配列が可能です。

この場合、'y ~ fixed + (random1|g1) + ... + (randomR|gR)' の形式の式において、項 fixed は固定効果の計画行列 X の仕様に対応し、random1 はグループ化変数 g1 に対応する変量効果の計画行列 Z1 の仕様であり、同様に randomR はグループ化変数 gR に対応する変量効果の計画行列 ZR の仕様です。fixed 項および random 項はウィルキンソンの表記法で表現できます。

ウィルキンソンの表記法は、モデルに存在する因子を記述します。この表記法は、モデルに存在する因子に関係するものであり、それらの因子の乗数 (係数) に関係するものではありません。

ウィルキンソンの表記法標準表記の因子
1定数 (切片) 項
X^kk は正の整数X, X2, ..., Xk
X1 + X2X1, X2
X1*X2X1, X2, X1.*X2 (elementwise multiplication of X1 and X2)
X1:X2X1.*X2 のみ
- X2X2 は含めない
X1*X2 + X3X1, X2, X3, X1*X2
X1 + X2 + X3 + X1:X2X1, X2, X3, X1*X2
X1*X2*X3 - X1:X2:X3X1, X2, X3, X1*X2, X1*X3, X2*X3
X1*(X2 + X3)X1, X2, X3, X1*X2, X1*X3

Statistics and Machine Learning Toolbox™ 表記は、-1 を使用して項を明示的に削除しない限り、常に定数項を含みます。線形混合効果モデルの仕様例を次にいくつか挙げます。

次に例を示します。

説明
'y ~ X1 + X2'切片 X1 および X2 の固定効果。これは、'y ~ 1 + X1 + X2' と等価です。
'y ~ -1 + X1 + X2'X1X2 の切片と固定効果はありません。-1 を含めることによって暗黙的な切片の項は抑制されます。
'y ~ 1 + (1 | g1)'グループ化変数 g1 の水準ごとの切片の固定効果と切片の変量効果の和。
'y ~ X1 + (1 | g1)'固定勾配のランダム切片モデル。
'y ~ X1 + (X1 | g1)'相関があり得るランダムな切片と勾配。これは、'y ~ 1 + X1 + (1 + X1|g1)' と等価です。
'y ~ X1 + (1 | g1) + (-1 + X1 | g1)' 切片と勾配の独立した変量効果項。
'y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1:g2)'g1g2 に対する独立したメイン効果のあるランダムな切片モデル + 独立した交互作用効果。

固定効果と変量効果の計画行列

fitlme は式の fixed 部分および random 部分 (グループ化変数ではない) の式を次のように計画行列に変換します。

  • 式内の項ごとに、1 つ以上の列を対応する計画行列に追加します。

  • 1 つの連続変数を含む項は、計画行列に 1 つの列を追加します。

  • k 水準のカテゴリカル変数 X を含む固定項は、計画行列に (k – 1) 個のダミー変数を追加します。

    たとえば、変数 Supplier が表す 3 つの異なる供給業者は、1 つの製造業者に部品を納入します。たとえば、カテゴリカル変数には 3 つの水準があり、部品の 6 つのバッチのうち、最初の 2 つのバッチは供給業者 1 (水準 1) から、次の 2 つのバッチは供給業者 2 (水準 2) から、最後の 2 つのバッチは供給業者 3 (水準 3) から提供されているとします。

    Supplier =
    
         1
         1
         2
         2
         3
         3 
    この場合、Supplier を固定効果または変量効果の項として式に追加すると、次の 2 つのダミー変数が 'reference' 対比を使用して対応する計画行列に追加されます。
     0     0
     0     0
     1     0
     1     0
     0     1
     0     1
    
    ダミー変数の詳細は、ダミー変数を参照してください。その他の対比オプションについては、fitlme の名前と値のペアの引数 'DummyVarCoding' を参照してください。

  • X1 および X2 が連続変数の場合、積の項 X1:X2 は、X1X2 の要素ごとの乗算によって得られる 1 つの列を計画行列に追加します。

  • X1 が連続しており、X2 が k 個の水準をもつカテゴリカル変数の場合、積の項 X1:X2 は、要素ごとに X1X2 を表す (k – 1) 個のダミー変数と乗算し、これらの (k – 1) 個の列を計画行列に追加します。

    たとえば、Drug が患者に投与される薬の量 (連続の処理) であり、Time が健康測定を実施する 3 つの異なる時点 (3 つの水準をもつカテゴリカル変数) であり、9 回の観測数のうち最初の 3 回を時点 1、次の 3 回を時点 2、最後の 3 回を時点 3 に観測されるとします。

    [Drug Time] =
    
        0.1000    1.0000
        0.2000    1.0000
        0.5000    2.0000
        0.6000    2.0000
        0.3000    3.0000
        0.8000    3.0000
    この場合、積の項 Drug:Time は次の 2 つの変数を計画行列に追加します。

         0         0
         0         0
    0.5000         0
    0.6000         0
         0    0.3000
         0    0.8000
    
  • X1 および X2 がそれぞれ k 個および m 個の水準をもつカテゴリカル変数の場合、積の項 X1:X2 は (k – 1)*(m – 1) 個のダミー変数を計画行列に追加します。この計画行列は、X1X2 を表す各ダミー変数を要素ごとに乗算して形成されます。

    たとえば、トウモロコシの種類とポップコーン生産方法の影響を調べる実験において、次の 3 種類の Corn と 2 種類の Method があると仮定します。

        1    oil
        1    oil
        1    air
        1    air
        2    oil
        2    oil
        2    air
        2    air
        3    oil
        3    oil
        3    air
        3    air
    この場合、交互作用項 Corn:Method は次の内容を計画行列に追加します。

         0     0
         0     0
         0     0
         0     0
         1     0
         1     0
         0     0
         0     0
         0     1
         0     1
         0     0
         0     0
  • X1*X2 項には、X1X2 および X1:X2 に必要な列数を計画行列に追加します。

  • X1^2 項は必要な数の X1 および X1:X1 用の列を計画行列に追加します。

  • 式の中の記号 1 はすべてが 1 である列を表します。既定では、1 の列が計画行列に含められます。計画行列から 1 の列を除外するには、式に含まれる項として明示的に–1 を指定しなければなりません。

グループ化変数

fitlme はグループ化変数を次のように式の (.|group) 部分で扱います。

  • グループ化変数に k 個の水準がある場合、k 個のダミー変数がこのグループ化を表します。

    たとえば、District が 3 種類の地区を表す 3 つの水準のカテゴリカル グループ化変数であり、6 つの学校のうち最初の 2 校が地区 1、次の 2 校が地区 2、最後の 2 校が地区 3 にあると仮定します。

    District =
    
         1
         1
         2
         2
         3
         3
    
    この場合、このグループ化を表すダミー変数は次のようになります。
      1     0     0
      1     0     0
      0     1     0
      0     1     0
      0     0     1
      0     0     1

  • X1 が連続変量効果変数で X2 が k 個の水準をもつグループ化変数の場合、ランダム項 (X1 – 1|X2) は、X1 を要素ごとに X2 を表す k 個のダミー変数と乗算し、これら k 個の列を変量効果計画行列に追加します。

    たとえば、Score が学校の数学の試験における生徒の点数を表す連続変数であり、Class が学校の異なる 3 つのクラスを表す 3 つの水準のカテゴリカル変数であると仮定します。また、9 個の観察値のうち、最初の 3 つは 1 番目のクラスの生徒の点数、次の 3 つは 2 番目のクラスの生徒の点数、最後の 3 つが 3 番目のクラスの生徒の点数に対応すると仮定します。

    [Score Class] =
    
        78.0000    1.0000
        68.0000    1.0000
        81.0000    2.0000
        53.0000    2.0000
        85.0000    3.0000
        72.0000    3.0000
    この場合、ランダム項 (Score – 1|Class) は次の 3 つの列を変量効果計画行列に追加します。

     78.0000          0          0
     68.0000          0          0
           0    81.0000          0
           0    53.0000          0
           0          0    85.0000
           0          0    72.0000    
  • X1 が連続予測子変数で X2 および X3 はそれぞれ k 個と m 個の水準をもつグループ化変数の場合、項 (X1|X2:X3) は、X2 を表す各ダミー変数と X3 を表す各ダミー変数を要素ごとに乗算して形成される、k*m 個のダミー変数をもつ X1 のグループ化を表します。

    たとえば、Treatment が連続予測子変数であり、次のように 3 つの水準の Block と、ブロック内で入れ子になった 2 つの水準の Plot があると仮定します。

       0.1000    1    a
       0.2000    1    b 
       0.5000    2    a  
       0.6000    2    b 
       0.3000    3    a 
       0.8000    3    b  

    この場合、ランダム項 (Treatment – 1|Block:Plot) は次の内容を変量効果計画行列に追加します。

     0.1000         0         0         0         0         0
          0    0.2000         0         0         0         0
          0         0    0.5000         0         0         0
          0         0         0    0.6000         0         0
          0         0         0         0    0.3000         0
          0         0         0         0         0    0.8000

参考

| |

関連するトピック