2 つの標本による仮説検定

仮説検定を使用して、時期の異なる 2 か月間にマサチューセッツ州全体で測定されたガソリン価格を解析します。

はじめに

仮説検定は、標本からの統計上の証拠に基づき、母集団についての推定を引き出す一般的な方法です。たとえば、マサチューセッツ州のある時点でのレギュラー無鉛ガソリン 1 ガロンの価格が、平均で 1.15 ドルであるという主張があるとします。この主張が正しいかどうかはどのように決めたら良いでしょうか。この州のすべてのガソリンスタンドがその時点で、いくらの価格を付けたのか調べることができたとします。これは決定的なアプローチですが、時間を浪費し、コストがかかり、不可能とさえ思えます。

より簡単なアプローチは、無作為に選んだ少数のガソリンスタンドでガソリンの価格を調べ、その平均価格を計算することです。

標本平均は、選択の過程での偶然のばらつきにより、相互に異なります。現在の標本平均が 1.18 ドルだったとします。この 3 セントの違いは、無作為に抽出したために不自然な結果になったのでしょうか。またはガソリン 1 ガロンの平均価格が実際に 1.15 ドルよりも高いという有効な証拠でしょうか。仮説検定は、そのような判断をするための統計的方法です。

データの読み込みと可視化

ファイル gas.mat のガソリン価格データを読み込みます。このファイルには、1993 年のマサチューセッツ州付近におけるガソリン 1 ガロンの価格について、2 つの無作為標本が含まれています。1 つ目の標本 price1 には、1 月のある日における州内各地のランダムな観測値 20 個が含まれています。2 つ目の標本 price2 には、1 か月後の州内各地のランダムな観測値 20 個が含まれています。

load gas
prices = [price1 price2];

正規確率を使用して、標本が正規分布からのものであるという仮定を検定します。

normplot(prices)

Figure contains an axes object. The axes object with title Normal Probability Plot, xlabel Data, ylabel Probability contains 6 objects of type line. One or more of the lines displays its values using only markers

どちらの点の集合も、標本の 1 番目と 3 番目の四分位を通る直線にほぼ従います。これは、近似的に正規分布であることを示します。2 月の標本 (右側のライン) は、裾の方で正規性から少しずれていることを示します。1 月から 2 月までの平均の移動は明らかです。

仮説検定の実行

仮説検定を使用して正規性の検定を定量化できます。各標本が比較的小さいので、リリーフォース検定を実行します。

lillietest(price1)

ans = 
0

lillietest(price2)

ans = 
0

lillietest の既定の有意水準は 5% です。各検定によって返される logical 0 は、標本が正規分布に従っているという帰無仮説を棄却できなかったことを示します。棄却できなかったことは、母集団の正規性を反映するかもしれません。あるいは、標本のサイズが小さいことが原因で、帰無仮説に対して、説得力のある証拠がないことを反映するかもしれません。

標本平均を計算します。

sample_means = mean(prices)

sample_means = 1×2

  115.1500  118.5000

1 月の標本で州全域の 1 日の平均価格が 1.15 ドルであったという帰無仮説を検定します。州の各地で価格の標準偏差が、それまでは常に $0.04 であったということを知っている場合は、z 検定が適しています。価格をセントではなくドルで表現するようにスケーリングします。

[ztest_h,ztest_p,ztest_ci] = ztest(price1/100,1.15,0.04)

ztest_h = 
0

ztest_p = 
0.8668

ztest_ci = 2×1

    1.1340
    1.1690

論理値の出力 ztest_h が 0 であり、既定の有意水準 5% では帰無仮説が棄却されなかったことを示します。この結果は、帰無仮説の場合は "p" 値により示される、極端な値として、または標本から計算された "z" 統計量よりも極端な値として値を観測する確率が高いことによるものです。平均 [1.1340,1.1690] の 95% 信頼区間は、仮定された母集団平均 1.15 ドルを含みます。

後者の標本について、2 月の州規模の平均価格が 1.15 ドルであるという帰無仮説を棄却する説得力のある証拠を提供するかどうかを調べます。確率プロットと計算された標本平均の差に示されるずれがこの結果を示します。このずれは、それまでの標準偏差を使う妥当性について、疑問を投げかけ、需要における有意なばらつきを示す可能性があります。既知の標準偏差が仮定できない場合は、t 検定が適しています。

[ttest_h,ttest_p,ttest_ci] = ttest(price2/100,1.15)

ttest_h = 
1

ttest_p = 
4.9517e-04

ttest_ci = 2×1

    1.1675
    1.2025

論理値の出力 ttest_h が 1 であり、既定の有意水準 5% で帰無仮説が棄却されたことを示します。この場合、平均の 95% 信頼区間は、仮定された母集団平均 $1.15 を含みません。

価格のずれをもう少し詳しく調べてみます。関数 ttest2 は、2 つの独立した標本が、同じ平均と異なる標準偏差 (未知) をもつ正規分布からのものであるかどうかを、平均が異なるという対立仮説に対して検定します。

[ttest2_h,ttest2_p,ttest2_ci] = ttest2(price1,price2,Vartype="unequal")

ttest2_h = 
1

ttest2_p = 
0.0083

ttest2_ci = 2×1

   -5.7846
   -0.9154

帰無仮説は既定の有意水準 5% で棄却され、平均差の信頼区間には、ゼロと仮定された値が含まれません。

このずれをノッチのある箱ひげ図を使用して可視化します。箱ひげ図は、中央値の周りの標本の分布を表示します。各ボックスのノッチの高さは、中央値が既定の有意水準 5% で異なる場合、並んだボックスのノッチが重ならないように計算されます。この計算は、データが正規分布するという仮定に基づいていますが、この比較は他の分布に対してもロバストです。並んだプロットは、平均よりも中央値を比較して一種の視覚的な仮説検定を提供します。

boxchart(prices,Notch="on")
xticklabels(["January","February"])
xlabel("Month")
ylabel("Prices ($0.01)")
yline([113.4 117.6 117.4 120.6],"--")

Figure contains an axes object. The axes object with xlabel Month, ylabel Prices ($0.01) contains 5 objects of type boxchart, constantline.

並んだボックスのノッチがわずかに重なっているため、このプロットでは中央値が等しいという帰無仮説を棄却できません。

別の方法として、ノンパラメトリックのウィルコクソン順位和検定を使用して、中央値が等しいかどうかの検定を定量化できます。ranksum 関数は、2 つの独立した標本が、同じ中央値をもつ同じ連続分布 (必ずしも正規分布ではない) からのものであるかどうかを、中央値が異なるという対立仮説に対して検定します。

[p,h] = ranksum(price1,price2)

p = 
0.0095

h = logical
   1

この検定は、等しい中央値をもつという帰無仮説を既定の 5% 有意水準で棄却します。箱ひげ図を使用した前の結果とは異なる結果になります。

参考

2 つの標本による仮説検定

はじめに

データの読み込みと可視化

仮説検定の実行

参考

トピック