係数の標準誤差と信頼区間
係数の共分散と標準誤差
目的
推定された係数の分散と共分散から、回帰係数の推定値の精度がわかります。係数の分散とその平方根 (標準誤差) は係数の仮説検定に便利です。
定義
推定される共分散行列は次のとおりです。
ここで、MSE は平均二乗誤差、X は予測子変数に関する観測値の行列です。CoefficientCovariance
は当てはめたモデルのプロパティであり、回帰係数の推定値の p 行 p 列の共分散行列です。p は回帰モデルにおける係数の数です。対角要素は各係数の分散です。
使用方法
近似モデル (mdl
など) を取得した後、fitlm
または stepwiselm
を使用して、次の方法により係数の共分散を表示できます。
mdl.CoefficientCovariance
係数の共分散と標準誤差の計算
この例では、共分散行列と係数の標準誤差の計算方法を示します。
標本データを読み込み、予測子変数と応答変数を定義します。
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
線形回帰モデルを当てはめます。
mdl = fitlm(X,y);
係数の共分散行列を表示します。
CM = mdl.CoefficientCovariance
CM = 5×5
27.5113 11.0027 -0.1542 -0.2444 0.2702
11.0027 8.6864 0.0021 -0.1547 -0.0838
-0.1542 0.0021 0.0045 -0.0001 -0.0029
-0.2444 -0.1547 -0.0001 0.0031 -0.0026
0.2702 -0.0838 -0.0029 -0.0026 1.0829
係数の標準誤差を計算します。
SE = diag(sqrt(CM))
SE = 5×1
5.2451
2.9473
0.0673
0.0557
1.0406
係数の信頼区間
目的
係数の信頼区間により線形回帰係数の推定の精度を測定できます。信頼区間が 100(1–α)% の場合、対応する回帰係数の信頼度の範囲は 100(1–α)% 内になります。
定義
ソフトウェアは、Wald 法を使用して信頼区間を求めます。回帰係数の 100(1 – α)% 信頼区間は、次のとおりです。
ここで、bi は係数の推定値、SE(bi) は係数の推定値の標準誤差、t(1–α/2,n–p) は自由度が n – p の t 分布の 100(1 – α/2) 百分位数です。n は観測値の個数、p は回帰係数の個数です。
使用方法
近似モデル (mdl
など) を取得した後、fitlm
または stepwiselm
を使用すると、次の方法で係数に対する既定の 95% 信頼区間を得ることができます。
coefCI(mdl)
次の方法で信頼度を変更することもできます。
coefCI(mdl,alpha)
詳細については、LinearModel
オブジェクトの関数 coefCI
を参照してください。
係数の信頼区間の計算
この例では、信頼区間の係数を計算する方法を示します。
標本データを読み込んで線形回帰モデルを当てはめます。
load hald
mdl = fitlm(ingredients,heat);
係数の 95% 信頼区間を表示します。
coefCI(mdl)
ans = 5×2
-99.1786 223.9893
-0.1663 3.2685
-1.1589 2.1792
-1.6385 1.8423
-1.7791 1.4910
各行の値はそれぞれ、係数の既定の 95% 信頼区間の下限と上限です。たとえば、1 行目は切片 の下限と上限 (-99.1786 と 223.9893) を表しています。同様に、2 行目は の下限と上限を表しています。この後の各行も同様です。
係数の 90% 信頼区間を表示します ( = 0.1)。
coefCI(mdl,0.1)
ans = 5×2
-67.8949 192.7057
0.1662 2.9360
-0.8358 1.8561
-1.3015 1.5053
-1.4626 1.1745
信頼度が低下すると信頼区間の範囲が狭くなります。
参考
LinearModel
| fitlm
| stepwiselm
| plotDiagnostics
| anova
| coefCI
| coefTest