指数分布

概要

指数分布は、1 パラメーターの曲線群です。指数分布は、過去の待ち時間と未来の待ち時間が独立であるときの待ち時間をモデル化します。たとえば、電球が次の使用時間内に、故障してしまう確率は、今までに何分間使用したかということとは相対的に独立しています。

Statistics and Machine Learning Toolbox™ には、指数分布を処理する方法がいくつか用意されています。

確率分布を標本データに当てはめる (fitdist) かパラメーター値を指定する (makedist) ことにより、確率分布オブジェクト ExponentialDistribution を作成します。そして、オブジェクト関数を使用して、分布の評価や乱数の生成などを行います。
分布フィッターアプリを使用して、指数分布を対話的に処理します。オブジェクトをアプリからエクスポートしてオブジェクト関数を使用できます。
分布パラメーターを指定して、分布特有の関数 (expcdf、exppdf、expinv、explike、expstat、expfit、exprnd) を使用します。分布特有の関数では、複数の指数分布についてのパラメーターを受け入れることができます。
分布名 ('Exponential') とパラメーターを指定して、汎用の分布関数 (cdf、icdf、pdf、random) を使用します。

パラメーター

指数分布は、次のパラメーターを使用します。

パラメーター	説明	サポート
`mu` (μ)	平均	μ `> 0`

パラメーター μ は、指数分布の標準偏差とも等しくなります。

標準指数分布では、μ=1 です。

指数分布をパラメーター化する一般的な代替手段は、事象が発生するまでの平均待ち時間 μ を使用する代わりに、ある区間の平均事象数として定義された λ を使用することです。λ と μ は互いに逆数の関係にあります。

パラメーター推定

"尤度関数" は、パラメーターの関数として見た場合の確率密度関数 (pdf) です。"最尤推定量" (MLE) は、x の値を固定した状態で尤度関数が最大になるパラメーター推定値です。

指数分布の μ の最尤推定量は、 $\bar{x} = \sum_{i = 1}^{n} \frac{x_{i}}{n}$ です。ここで、 $\bar{x}$ は、標本 x₁, x₂, …, x_n の標本平均です。標本平均は、パラメーター μ の不偏推定量です。

指数分布をデータに当てはめてパラメーター推定値を求めるには、expfit、fitdist または mle を使用します。パラメーター推定を返す expfit および mle と異なり、fitdist は当てはめた確率分布オブジェクト ExponentialDistribution を返します。オブジェクトプロパティ mu には、パラメーター推定が格納されます。

たとえば、データへの指数分布の当てはめを参照してください。

確率密度関数

指数分布の確率密度関数は次のようになります。

$y = f (x | μ) = \frac{1}{μ} e^{\frac{- x}{μ}} .$

ここで、x ≥ 0 であり、μ は事象が発生するまでの平均待ち時間です。

累積分布関数

指数分布の累積分布関数 (cdf) は次のようになります。

$p = F (x | u) = \int_{0}^{x} \frac{1}{μ} e^{\frac{- t}{μ}} d t = 1 - e^{\frac{- x}{μ}} .$

ここで、x ≥ 0 です。結果 p は、平均 μ をもつ指数分布に従う単一の観測値が区間 [0, x] に含まれる確率です。

たとえば、指数分布の累積分布関数の計算を参照してください。

逆累積分布関数

指数分布の逆累積分布関数 (icdf) は次のようになります。

$x = F^{- 1} (p | μ) = - μ \ln (1 - p) .$

結果 x は、パラメーター μ をもつ指数分布に従う観測値が p の確率で範囲 [0 x] に含まれるような値です。

ハザード関数

ハザード関数 (瞬間故障率) は、pdf と cdf の補数との比です。f(t) と F(t) が、それぞれ分布の確率密度関数と累積分布関数の場合、ハザード率は $h (t) = \frac{f (t)}{1 - F (t)}$ で表されます。f(t) と F(t) を指数分布の確率密度関数と累積分布関数で置き換えると、定数 λ になります。指数分布は、ハザード関数が一定である唯一の連続分布です。λ は μ の逆数で、特定の時間間隔において事象が発生する割合と解釈できます。したがって、生存時間をモデル化した場合、ある個体がさらに単位時間生き残る確率は、個体の現在の年齢とは無関係となります。

たとえば、指数分布した寿命を参照してください。

例

データへの指数分布の当てはめ

ライブスクリプトを開く

平均 700 をもつ指数分布に従う 100 個の乱数の標本を生成します。

x = exprnd(700,100,1); % Generate sample

fitdist を使用して指数分布をデータに当てはめます。

pd = fitdist(x,'exponential')

pd = 
  ExponentialDistribution

  Exponential distribution
    mu = 641.934   [532.598, 788.966]

fitdist は、ExponentialDistribution オブジェクトを返します。パラメーター推定値の横にある区間は、分布パラメーターの 95% 信頼区間です。

分布関数を使用してパラメーターを推定します。

[muhat,muci] = expfit(x) % Distribution specific function

muhat = 
641.9342

muci = 2×1

  532.5976
  788.9660

[muhat2,muci2] = mle(x,'distribution','exponential') % Generic distribution function

muhat2 = 
641.9342

muci2 = 2×1

  532.5976
  788.9660

指数分布の確率密度関数の計算

ライブスクリプトを開く

パラメーター mu = 2 を使用して指数分布の確率密度関数を計算します。

x = 0:0.1:10;
y = exppdf(x,2);

確率密度関数をプロットします。

figure;
plot(x,y)
xlabel('Observation')
ylabel('Probability Density')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Probability Density contains an object of type line.

指数分布の累積分布関数の計算

ライブスクリプトを開く

パラメーター mu = 2 を使用して指数分布の累積分布関数を計算します。

x = 0:0.1:10;
y = expcdf(x,2);

累積分布関数をプロットします。

figure;
plot(x,y)
xlabel('Observation')
ylabel('Cumulative Probability')

Figure contains an axes object. The axes object with xlabel Observation, ylabel Cumulative Probability contains an object of type line.

指数分布した寿命

ライブスクリプトを開く

値 1 ～ 5 での、平均 mu = 2 をもつ指数分布のハザード関数を計算します。

x = 1:5;
lambda1 = exppdf(x,2)./(1-expcdf(x,2))

lambda1 = 1×5

    0.5000    0.5000    0.5000    0.5000    0.5000

指数分布のハザード関数 (生存に対する瞬間故障率) は定数で、常に 1/mu になります。この定数は、多くの場合 λ で表されます。

x = 3 での、平均 1 ～ 5 をもつ指数分布のハザード関数を評価します。

mu = 1:5;
lambda2 = exppdf(3,mu)./(1-expcdf(3,mu))

lambda2 = 1×5

    1.0000    0.5000    0.3333    0.2500    0.2000

指数分布に従う寿命をもつ個体がさらに 1 単位時間生き残る確率は、その個体がこれまで生き残ってきた時間とは無関係です。

平均生存時間が 10 年である場合に、さまざまな年齢の個体がさらに 1 年生存する確率を計算します。

x2 = 5:5:25;
x3 = x2 + 1;
deltap = (expcdf(x3,10)-expcdf(x2,10))./(1-expcdf(x2,10))

deltap = 1×5

    0.0952    0.0952    0.0952    0.0952    0.0952

ある個体がさらに 1 年生存する確率は、その個体がこれまで生き残ってきた時間とは関係なく同じになります。

参照

[1] Crowder, Martin J., ed. Statistical Analysis of Reliability Data. Reprinted. London: Chapman & Hall, 1995.

[2] Kotz, Samuel, and Saralees Nadarajah. Extreme Value Distributions: Theory and Applications. London : River Edge, NJ: Imperial College Press; Distributed by World Scientific, 2000.

[3] Meeker, W. Q., and L. A. Escobar. Statistical Methods for Reliability Data. Hoboken, NJ: John Wiley & Sons, Inc., 1998.

[4] Lawless, J. F. Statistical Models and Methods for Lifetime Data. 2nd ed., Hoboken, NJ: John Wiley & Sons, Inc., 2003.

参考

指数分布

概要

パラメーター

パラメーター推定

確率密度関数

累積分布関数

逆累積分布関数

ハザード関数

例

データへの指数分布の当てはめ

指数分布の確率密度関数の計算

指数分布の累積分布関数の計算

指数分布した寿命

関連する分布

参照

参考

トピック