ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

正規分布

定義

正規確率密度関数は、次の式で表されます。

y=f(x|μ,σ)=1σ2πe(xμ)22σ2,forx.

背景

正規分布は、パラメーターを 2 つもつ曲線群です。1 つ目のパラメーター µ は平均です。2 つ目のパラメーター σ は標準偏差です。標準正規分布 (Φ(x) と書く) では、μ が 0 に、σ が 1 に設定されます。

Φ(x) の機能は、次の誤差関数 erf に関係しています。

Φ(x)=12(1erf(x2))

正規分布は初め、二項分布の連続近似として使われました。

モデル化に正規分布を使用することは、中心極限定理により正当化されます。この定理 (の概略) は、有限の平均と分散をもつ分布から抽出した独立標本の和は、標本数が無限大に近付くにつれて正規分布に近付くというものです。

パラメーター

平均や標準偏差などの統計パラメーターを正確に使用するためには、これらの適切な評価が必要です。最尤推定 (MLE) は、そのような評価を提供します。しかし、最尤推定が偏っている可能性もあります。これは、そのパラメーターの期待値が、推定されているパラメーター値と等しくない可能性があることを意味します。たとえば、MLE で正規分布の分散を指定すると偏りが生じます。正規分布のパラメーターを推定するために、一般的に使用されている不偏推定量は、最小分散不偏推定量 (minimum variance unbiased estimatorMVUE) です。最小分散不偏推定量は、パラメーターのすべての不偏推定量の中で最小の分散をもちます。

正規分布のパラメーター µσ2 の最小分散不偏推定は、標本の平均と分散になります。また、標本平均は µ に対する最尤推定です。分散には、次の 2 つのよく使われる式があります。

sMLE2=1ni=1n(xix¯)2.(1)
s2=1n1i=1n(xix¯)2(2)

ここで、

x¯=i=1nxin

式 1 は σ2 の最尤推定量、式 2 は最小分散不偏推定量です。

正規分布をデータにあてはめてパラメーター推定を求めるには、normfitfitdist または mle を使用します。

  • 打ち切りがないデータの場合、normfitfitdist は分布パラメーターの不偏推定量を、mle は最尤推定量を求めます。

  • 打ち切りがあるデータの場合、normfitfitdist および mle は最尤推定量を求めます。

パラメーター推定を返す normfit および mle と異なり、fitdist はあてはめた確率分布オブジェクト NormalDistribution を返します。オブジェクト プロパティ mu および sigma にはパラメーター推定が格納されます。

たとえば、アメリカ合衆国の小学校 4 年生の生徒すべての身長の平均 µ と分散 σ2 を推定してみましょう。関数 normfit は、µ に対して MVUE、σ2 に対して MVUE の平方根、µσ2 に対して信頼区間を返します。これは 4 年生のクラスから無作為に抽出された身長 (単位: インチ) のモデリングの例です。

rng default;  % For reproducibility
height = normrnd(50,2,30,1);  % Simulate heights
[mu,s,muci,sci] = normfit(height)
mu = 51.1038
s = 2.6001
muci = 2×1

   50.1329
   52.0747

sci = 2×1

    2.0707
    3.4954

s^2 は、分散の MVUE であることに注意してください。

s^2
ans = 6.7605

正規分布確率密度関数の計算とプロット

パラメーター = 0 および = 1 を使用して、標準的な正規分布の確率密度関数を計算します。

x = [-3:.1:3];
norm = normpdf(x,0,1);

確率密度関数をプロットします。

figure;
plot(x,norm)

参考

関連する例

詳細