ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

線形回帰モデルとは

回帰モデルは、1 つの "従属変数" y と 1 つまたは複数の "独立変数" X の関係を記述します。従属変数は、"応答変数" とも呼ばれます。独立変数は、"説明変数" または "予測子変数"とも呼ばれます。連続予測子変数は、"共変量" と呼ばれ、カテゴリカル予測子変数は "因子" と呼ばれる場合もあります。予測子変数に関する観測値の行列 X は通常 "計画行列" と呼ばれます。

多重線形回帰モデルは以下のとおりです。

yi=β0+β1Xi1+β2Xi2++βpXip+εi,i=1,,n,

ここで、

  • yi は i 番目の応答です。

  • βk は k 番目の係数で、β0 はモデルの定数項です。計画行列には、定数項に関する情報が含まれる場合があります。ただし、fitlm または stepwiselm には既定でモデルの定数項が含まれるため、計画行列 X に 1 の列を入力しないでください。

  • Xij は、j 番目の予測子変数 j = 1, ..., p の i 番目の観測値です。

  • εi は i 番目のノイズ項、つまり確率的誤差です。

通常、線形回帰モデルは以下の形式のモデルになります。

yi=β0+k=1Kβkfk(Xi1,Xi2,,Xip)+εi,i=1,,n,

ここで、f(.) は独立変数 Xij のスカラー値関数です。関数 f (X) の形式に制限はなく、非線形関数や多項式になることもあります。線形回帰モデルにおける線形性は、係数 βk の線形性を意味します。つまり、応答変数 y は、係数 βk の線形関数を表します。

次に、線形モデルの例をいくつか示します。

yi=β0+β1X1i+β2X2i+β3X3i+εiyi=β0+β1X1i+β2X2i+β3X1i3+β4X2i2+εiyi=β0+β1X1i+β2X2i+β3X1iX2i+β4logX3i+εi

しかし、次のモデルは未知係数 βk に対して線形になっていないので、線形モデルではありません。

logyi=β0+β1X1i+β2X2i+εiyi=β0+β1X1i+1β2X2i+eβ3X1iX2i+εi

線形回帰モデルの通常の仮定は以下のとおりです。

  • ノイズ項 εi は無相関です。

  • ノイズ項 εi は、平均 0 と一定分散 σ2 をもつ独立した同一の正規分布となります。したがって、以下のようになります。

    E(yi)=E(k=0Kβkfk(Xi1,Xi2,,Xip)+εi)=k=0Kβkfk(Xi1,Xi2,,Xip)+E(εi)=k=0Kβkfk(Xi1,Xi2,,Xip)

    および

    V(yi)=V(k=0Kβkfk(Xi1,Xi2,,Xip)+εi)=V(εi)=σ2

    yi の分散は、Xij のすべてのレベルで同じになります。

  • 応答 yi は無相関です。

近似線形関数は次のようになります。

y^i=k=0Kbkfk(Xi1,Xi2,,Xip),i=1,,n,

ここで、y^i は推定応答、bk は近似係数です。係数は、予測ベクトル y^ と実際の応答ベクトル y の二乗平均誤差、つまり y^y が最小になるように推定されます。この方法は、"最小二乗法" と呼ばれます。ノイズ項に関する仮定のもとでは、これらの係数もまた予測ベクトルの尤度を最大化します。

y = β1X1 + β2X2 + ...+ βpXp という形式の線形回帰モデルにおける係数 βk は、他の変数をすべて固定して予測子変数 Xj を 1 単位変更した場合の、応答の平均 E(y) に対する影響を表します。係数の符号は影響の方向を示します。たとえば、線形モデルが E(y) = 1.8 – 2.35X1 + X2 の場合、–2.35 は、X2 が一定であることを前提に、X1 で 1 単位増加すると平均応答値が 2.35 単位減少することを示します。モデルが E(y) = 1.1 + 1.5X12 + X2 の場合、X12 の係数は、他がすべて一定であることを前提に、X12 で 1 単位増加すると Y の平均値が 1.5 単位増加することを示します。ただし、E(y) = 1.1 + 2.1X1 + 1.5X12 の場合は、係数を同様に解釈することが難しくなります。これは、X12 が変更された場合 X1 を一定にすることができなくなるためです (またはその逆の場合もあります)。

参照

[1] Neter, J., M. H. Kutner, C. J. Nachtsheim, and W. Wasserman. Applied Linear Statistical Models. IRWIN, The McGraw-Hill Companies, Inc., 1996.

[2] Seber, G. A. F. Linear Regression Analysis. Wiley Series in Probability and Mathematical Statistics. John Wiley and Sons, Inc., 1977.

参考

| |

関連する例

この情報は役に立ちましたか?