ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

ガンマ分布

定義

ガンマ確率密度関数は、次の式で表されます。

y=f(x|a,b)=1baΓ(a)xa1exb

ここで、Γ( · ) はガンマ関数、a は形状パラメーター、b はスケール パラメーターです。

背景

ガンマ分布は、指数分布した確率変数の和のモデルです。

ガンマ分布族は 2 つのパラメーターを前提とします。カイ二乗分布と指数分布は、ガンマ分布の特別な場合であり、2 つのガンマ パラメーターのうちのどちらか 1 つを固定させ、他のパラメーターに基づく分布です。

ガンマ分布は、不完全ガンマ関数と次のような関係にあります。

f(x|a,b)=gammainc(xb,a)

a が大きいとき、ガンマ分布は正規分布に極めて近くなり、正の実数上にのみ密度をもつという利点があります。

パラメーター

コンピューター メモリ チップの寿命の耐久テストを行い、その寿命のデータを考えます。これらの寿命は、ガンマ分布に従うと仮定します。平均的なコンピューター メモリ チップは、どのくらい長もちするのでしょうか。パラメーター推定は、ある判断基準上で最も適したガンマ分布のパラメーターを決定するプロセスです。

値の適合度合の規範として、一般的なものの 1 つは、尤度関数を最大にすることです。尤度は、上記のガンマ確率密度関数と同じ型をもちます。しかし、確率密度関数において、パラメーターは既知の定数であり、変数は x です。尤度関数は、この関係が逆になります。この場合、標本値 (x の値) は、既に観測されています。それらの値は、固定された定数です。変数は未知パラメーターです。最尤推定 (MLE) は、ある特定のデータを与えられたとき、最尤を与えるパラメーターを計算するプロセスです。

関数 gamfit は、ガンマ分布の最尤推定とパラメーターの信頼区間を出力します。これは、a = 10、b = 5 のガンマ分布から発生させた乱数を使用した例です。

lifetimes = gamrnd(10,5,100,1);
[phat, pci] = gamfit(lifetimes)
phat =
   
    10.9821    4.7258

pci =

    7.4001    3.1543
   14.5640    6.2974

phat(1) = â および phat(2) = b^ であることに注意してください。パラメーター a の最尤推定量は 10.98 であり、真の値は 10 です。a の 95% 信頼区間は 7.4 ~ 14.6 であり、真の値が含まれています。

同様に、パラメーター b の最尤推定量は 4.7 ですが、真の値は 5 です。b の 95% 信頼区間は 3.2 から 6.3 までであり、真の値も含まれています。

寿命テストにおいて、ab の真の値を知ることはできませんので、真の値が存在するであろう範囲を与えるパラメーターの信頼区間を知ることは大切です。

ガンマ分布と正規分布の pdf の比較

ガンマ分布には、形状パラメーター a とスケール パラメーター b があります。a が大きくなると、ガンマ分布は平均 μ=ab および分散 σ2=ab2 をもつ正規分布に近づきます。A = 100 および B = 10 の各パラメーターを使用してガンマ分布の確率密度関数を計算します。比較のため、パラメーター mu = 1000 および sigma = 100 を使用して正規分布の確率密度関数も計算します。

x = gaminv((0.005:0.01:0.995),100,10);
y_gam = gampdf(x,100,10);
y_norm = normpdf(x,1000,100);

ガンマ分布と正規分布の確率密度関数を、同じ Figure にプロットします。

plot(x,y_gam,'-',x,y_norm,'-.')
title('Gamma and Normal pdfs')
legend('Gamma Distribution','Normal Distribution')

参照

[1] Hahn, Gerald J., and S. S. Shapiro. Statistical Models in Engineering. Hoboken, NJ: John Wiley & Sons, Inc., 1994, p. 88.

参考

関連するトピック