ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

階層型多項モデル

応答変数の結果は、取りうる値の制限されたセットの 1 つである場合があります。性別を表す男性または女性など、可能な結果が 2 つしかない場合、これらの応答は二項反応と呼ばれます。複数の結果がある場合、これらの応答は多値応答と呼ばれます。通常、これらの応答は、都市内で人気のある居住区、病気の症状の程度、特定の花の種類など、数量ではなく品質を表します。多値応答には、相互に独立していないカテゴリが含まれることもあります。代わりに、応答は逐次的方法で行われるか、1 つのカテゴリが前のカテゴリの入れ子にされます。これらのタイプの応答は、"階層型多項応答"、"逐次的多項応答" または "入れ子型多項応答" と呼ばれています。

たとえば、1 人が 1 日に吸うタバコの数が応答である場合、最初のレベルは、その人が喫煙者かどうかということになります。その人が喫煙者である場合、吸うタバコの数は 1 日につき 1 ~ 5 本または 6 本以上とすることができます。6 本以上である場合、該当者は 1 日に 6 ~ 10 本または 10 本以上のタバコを吸う可能性があり、その後も同様に続いていきます。各レベルのリスク グループもレベルに従って変わります。レベル 1 のリスク グループは、関連するすべての個人 (喫煙者または非喫煙者) で、m となります。m 人の中で、y1 人が非喫煙者である場合、レベル 2 のリスク グループは、すべての喫煙者の数、つまり m – y1 となります。これらの m – y1 人のうちの y2 が 1 日 1 ~ 5 本のタバコを吸っている場合、レベル 3 のリスク グループは m – y1 – y2 となります。したがって、各レベルでは、そのカテゴリに含まれる人の数が条件付き二項観測値になります。

階層型多項回帰モデルは、条件付きバイナリ観測値に基づくバイナリ回帰モデルの拡張です。既定はカテゴリ間で異なる切片と勾配 (係数) を使用するモデルで、この場合 mnrfit は一連の条件付き二項モデルをあてはめます。mnrfit'interactions','on' 名前と値のペアでこれを指定します。既定のリンク関数はロジットであり、mnrfit'link','logit' 名前と値のペアでこのモデルを指定します。

個人が前のカテゴリに含まれていないことを前提に、個人がカテゴリ j に含まれる確率を πj とし、応答がカテゴリ j または前のカテゴリに属している累積確率を P(y ≤ cj) とします。したがって、階層モデルがロジット リンク関数と異なる勾配を備えていると仮定すると、次のようになります。

ln(π11P(yc1))=ln(π11π1)=α1+β11X1+β12X2++β1pXp,ln(π21P(yc2))=ln(π21(π1+π2))=α2+β21X2+β22X2++β2pXp,ln(πk11P(yck1))=ln(πk11(π1++πk1))=αk1+β(k1)1X1+β(k1)2X2++β(k1)pXp.

たとえば、4 つの逐次的カテゴリをもつ応答変数の場合、次のような 4 – 1 = 3 個の方程式があるとします。

ln(π1π+2π+3π4)=α1+β11X1+β12X2++β1pXp,ln(π2π+3π4)=α2+β21X1+β22X2++β2pXp,ln(π3π4)=α3+β31X1+β32X2++β3pXp.

係数 βij は各レベル内で解釈されます。たとえば、前の喫煙の例の場合、β12 は、他がすべて一定であることを前提に、個人が喫煙者である場合と非喫煙者である場合の対数オッズに対する X2 の影響を示します。または、β22 は、個人が喫煙者であり、他がすべて一定であることを前提に、その人が 1 日に 1 ~ 5 本のタバコを吸う場合と 6 本以上吸う場合の対数オッズに対する X2 の影響を示します。同様に、β23 は、個人が 1 日 6 本以上のタバコを吸うことと、他がすべて一定であることを前提に、その人が 1 日に 6 ~ 10 本のタバコを吸う場合と 11 本以上吸う場合の対数オッズに対する X2 の影響を示します。

階層モデルには他のリンク関数を指定できます。名前と値のペア引数 'link','probit' では、プロビット リンク関数を使用します。別の勾配の仮定を使用すると、モデルは次のようになります。

Φ1(π1)=α1+β11X1++β1pXp,Φ1(π2)=α2+β21X1++β2pXp,Φ1(πk)=αk+βk1X1++βkpXp,

ここで、πj は、カテゴリ j に含まれるという条件付き確率です。カテゴリ j の前のカテゴリに含まれていないことが前提となります。また、Φ-1(.) は、標準正規累積分布関数の逆関数です。

mnrfit を使用してモデル係数を推定した後、mnrval と名前と値のペア引数 'type','conditional' を使用して、累積確率または各カテゴリの累積数を推定できます。関数 mnrfit は、mnrval が返す係数推定値とモデル統計を受け入れ、カテゴリカル確率または各カテゴリの数とそれらの信頼限界を推定します。mnrval の名前と値のペア引数 'type' の値を変更して、推定するカテゴリまたは累積確率あるいは数を指定できます。

参照

[1] McCullagh, P., and J. A. Nelder. Generalized Linear Models. New York: Chapman & Hall, 1990.

[2] Liao, T. F. Interpreting Probability Models: Logit, Probit, and Other Generalized Linear Models Series: Quantitative Applications in the Social Sciences. Sage Publications, 1994.

参考

| | | |

関連するトピック