式と計画行列の関係
式
一般に、モデル仕様の式は 'y ~ terms'
という形式の文字ベクトルまたは string スカラーです。線形混合効果モデルでは、この式は 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'
の形式になります。ここで、fixed
および random
には固定効果および変量効果の項が含まれます。
テーブル tbl
に以下のものが格納されていると仮定します。
応答変数
y
連続変数またはグループ化変数である予測子変数
Xj
グループ化変数
g1
、g2
、...、gR
ここで、Xj
および gr
のグループ化変数は、categorical 配列、logical 配列、文字配列、string 配列、または文字ベクトルの cell 配列が可能です。
この場合、'y ~ fixed + (random1|g1) + ... + (randomR|gR)'
の形式の式において、項 fixed
は固定効果の計画行列 X
の仕様に対応し、random
1 はグループ化変数 g
1 に対応する変量効果の計画行列 Z
1 の仕様であり、同様に random
R はグループ化変数 g
R に対応する変量効果の計画行列 Z
R の仕様です。fixed
項および random
項はウィルキンソンの表記法で表現できます。
ウィルキンソンの表記法は、モデルに存在する因子を記述します。この表記法は、モデルに存在する因子に関係するものであり、それらの因子の乗数 (係数) に関係するものではありません。
ウィルキンソンの表記法 | 標準表記の因子 |
---|---|
1 | 定数 (切片) 項 |
X^k 、k は正の整数 | X , X2 , ..., Xk |
X1 + X2 | X1 , X2 |
X1*X2 | X1 , X2 , X1.*X2 (elementwise multiplication of X1 and X2) |
X1:X2 | X1.*X2 のみ |
- X2 | X2 は含めない |
X1*X2 + X3 | X1 , X2 , X3 , X1*X2 |
X1 + X2 + X3 + X1:X2 | X1 , X2 , X3 , X1*X2 |
X1*X2*X3 - X1:X2:X3 | X1 , X2 , X3 , X1*X2 , X1*X3 , X2*X3 |
X1*(X2 + X3) | X1 , X2 , X3 , X1*X2 , X1*X3 |
Statistics and Machine Learning Toolbox™ 表記は、-1
を使用して項を明示的に削除しない限り、常に定数項を含みます。線形混合効果モデルの仕様例を次にいくつか挙げます。
次に例を示します。
式 | 説明 |
---|---|
'y ~ X1 + X2' | 切片 X1 および X2 の固定効果。これは、'y ~ 1 + X1 + X2' と等価です。 |
'y ~ -1 + X1 + X2' | X1 と X2 の切片と固定効果はありません。-1 を含めることによって暗黙的な切片の項は抑制されます。 |
'y ~ 1 + (1 | g1)' | グループ化変数 g1 の水準ごとの切片の固定効果と切片の変量効果の和。 |
'y ~ X1 + (1 | g1)' | 固定勾配のランダム切片モデル。 |
'y ~ X1 + (X1 | g1)' | 相関があり得るランダムな切片と勾配。これは、'y ~ 1 + X1 + (1 + X1|g1)' と等価です。 |
'y ~ X1 + (1 | g1) + (-1 + X1 | g1)' | 切片と勾配の独立した変量効果項。 |
'y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1:g2)' | g1 と g2 に対する独立したメイン効果のあるランダムな切片モデル + 独立した交互作用効果。 |
固定効果と変量効果の計画行列
fitlme
は式の fixed
部分および random
部分 (グループ化変数ではない) の式を次のように計画行列に変換します。
式内の項ごとに、1 つ以上の列を対応する計画行列に追加します。
1 つの連続変数を含む項は、計画行列に 1 つの列を追加します。
k 水準のカテゴリカル変数
X
を含む固定項は、計画行列に (k – 1) 個のダミー変数を追加します。たとえば、変数
Supplier
が表す 3 つの異なる供給業者は、1 つの製造業者に部品を納入します。たとえば、カテゴリカル変数には 3 つの水準があり、部品の 6 つのバッチのうち、最初の 2 つのバッチは供給業者 1 (水準 1) から、次の 2 つのバッチは供給業者 2 (水準 2) から、最後の 2 つのバッチは供給業者 3 (水準 3) から提供されているとします。この場合、Supplier = 1 1 2 2 3 3
Supplier
を固定効果または変量効果の項として式に追加すると、次の 2 つのダミー変数が'reference'
対比を使用して対応する計画行列に追加されます。ダミー変数の詳細は、ダミー変数を参照してください。その他の対比オプションについては、0 0 0 0 1 0 1 0 0 1 0 1
fitlme
の名前と値のペアの引数'DummyVarCoding'
を参照してください。X1
およびX2
が連続変数の場合、積の項X1:X2
は、X1
とX2
の要素ごとの乗算によって得られる 1 つの列を計画行列に追加します。X1
が連続しており、X2
が k 個の水準をもつカテゴリカル変数の場合、積の項X1:X2
は、要素ごとにX1
をX2
を表す (k – 1) 個のダミー変数と乗算し、これらの (k – 1) 個の列を計画行列に追加します。たとえば、
Drug
が患者に投与される薬の量 (連続の処理) であり、Time
が健康測定を実施する 3 つの異なる時点 (3 つの水準をもつカテゴリカル変数) であり、9 回の観測数のうち最初の 3 回を時点 1、次の 3 回を時点 2、最後の 3 回を時点 3 に観測されるとします。この場合、積の項[Drug Time] = 0.1000 1.0000 0.2000 1.0000 0.5000 2.0000 0.6000 2.0000 0.3000 3.0000 0.8000 3.0000
Drug:Time
は次の 2 つの変数を計画行列に追加します。0 0 0 0 0.5000 0 0.6000 0 0 0.3000 0 0.8000
X1
およびX2
がそれぞれ k 個および m 個の水準をもつカテゴリカル変数の場合、積の項X1:X2
は (k – 1)*(m – 1) 個のダミー変数を計画行列に追加します。この計画行列は、X1
とX2
を表す各ダミー変数を要素ごとに乗算して形成されます。たとえば、トウモロコシの種類とポップコーン生産方法の影響を調べる実験において、次の 3 種類の
Corn
と 2 種類のMethod
があると仮定します。この場合、交互作用項1 oil 1 oil 1 air 1 air 2 oil 2 oil 2 air 2 air 3 oil 3 oil 3 air 3 air
Corn:Method
は次の内容を計画行列に追加します。0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0
X1*X2
項には、X1
、X2
およびX1:X2
に必要な列数を計画行列に追加します。X1^2
項は必要な数のX1
およびX1:X1
用の列を計画行列に追加します。式の中の記号
1
はすべてが 1 である列を表します。既定では、1 の列が計画行列に含められます。計画行列から 1 の列を除外するには、式に含まれる項として明示的に–1
を指定しなければなりません。
グループ化変数
fitlme
はグループ化変数を次のように式の (.|group)
部分で扱います。
グループ化変数に k 個の水準がある場合、k 個のダミー変数がこのグループ化を表します。
たとえば、
District
が 3 種類の地区を表す 3 つの水準のカテゴリカル グループ化変数であり、6 つの学校のうち最初の 2 校が地区 1、次の 2 校が地区 2、最後の 2 校が地区 3 にあると仮定します。この場合、このグループ化を表すダミー変数は次のようになります。District = 1 1 2 2 3 3
1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1
X1
が連続変量効果変数でX2
が k 個の水準をもつグループ化変数の場合、ランダム項(X1 – 1|X2)
は、X1
を要素ごとにX2
を表す k 個のダミー変数と乗算し、これら k 個の列を変量効果計画行列に追加します。たとえば、
Score
が学校の数学の試験における生徒の点数を表す連続変数であり、Class
が学校の異なる 3 つのクラスを表す 3 つの水準のカテゴリカル変数であると仮定します。また、9 個の観察値のうち、最初の 3 つは 1 番目のクラスの生徒の点数、次の 3 つは 2 番目のクラスの生徒の点数、最後の 3 つが 3 番目のクラスの生徒の点数に対応すると仮定します。この場合、ランダム項[Score Class] = 78.0000 1.0000 68.0000 1.0000 81.0000 2.0000 53.0000 2.0000 85.0000 3.0000 72.0000 3.0000
(Score – 1|Class)
は次の 3 つの列を変量効果計画行列に追加します。78.0000 0 0 68.0000 0 0 0 81.0000 0 0 53.0000 0 0 0 85.0000 0 0 72.0000
X1
が連続予測子変数でX2
およびX3
はそれぞれ k 個と m 個の水準をもつグループ化変数の場合、項(X1|X2:X3)
は、X2
を表す各ダミー変数とX3
を表す各ダミー変数を要素ごとに乗算して形成される、k*m 個のダミー変数をもつX1
のグループ化を表します。たとえば、
Treatment
が連続予測子変数であり、次のように 3 つの水準のBlock
と、ブロック内で入れ子になった 2 つの水準のPlot
があると仮定します。0.1000 1 a 0.2000 1 b 0.5000 2 a 0.6000 2 b 0.3000 3 a 0.8000 3 b
この場合、ランダム項
(Treatment – 1|Block:Plot)
は次の内容を変量効果計画行列に追加します。0.1000 0 0 0 0 0 0 0.2000 0 0 0 0 0 0 0.5000 0 0 0 0 0 0 0.6000 0 0 0 0 0 0 0.3000 0 0 0 0 0 0 0.8000
参考
LinearMixedModel
| fitlme
| fitlmematrix