ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

幾何分布

概要

幾何分布は、それぞれの試行の結果が成功か失敗のどちらかである一連の独立試行において、1 回成功するまでの失敗回数をモデル化します。各試行の成功確率は定数です。たとえばコインを投げる場合、表が出るまでに観測された裏の出る回数を幾何分布でモデル化します。幾何分布は離散で、非負整数にのみ存在します。

パラメーター

幾何分布は、次のパラメーターを使用します。

パラメーター説明
0p1成功確率

確率分布関数

定義

幾何分布の pdf (確率分布関数) は以下のようになります。

y=f(x|p)=p(1p)x;x=0,1,2,,

p は成功の確率で、x は最初に成功するまでに失敗した回数です。結果の y は、任意の試行の成功確率が p のときに、成功するまでに x 回の試行を正確に観測する確率です。離散分布に対して、確率分布関数は pmf (確率質量関数) とも呼ばれます。

プロット

このプロットは、確率パラメーター p の値の変化が、確率分布関数の形状にどのような変化を与えるかを示しています。geopdf を使用して、3 つの異なる p 値について、1 から 10 までの x 値の確率密度関数を計算します。次に、3 つすべての確率密度関数を同じ図にプロットして、視覚的に比較します。

x = [1:10];
y1 = geopdf(x,0.1);   % For p = 0.1
y2 = geopdf(x,0.25);  % For p = 0.25
y3 = geopdf(x,0.75);  % For p = 0.75

figure;
plot(x,y1,'kd')
hold on
plot(x,y2,'ro')
plot(x,y3,'b+')
legend({'p = 0.1','p = 0.25','p = 0.75'})
hold off

このプロットの y の値は、成功するまでに x 回の試行を正確に観測する確率です。成功 p の確率が高い場合、x が増加するにつれ y は急激に減少し、成功するまでの失敗回数が多く観測される確率が急速に低下します。しかし、成功確率 p が低い場合、x の増加につれ、y はゆっくりと減少します。成功するまでの失敗回数が多く観測される確率も、試行回数が増加するにつれてやはり減少してゆきますが、はるかに遅い速度になります。

乱数発生

幾何分布から生成される乱数は、独立試行ごとに成功確率 p が与えられる場合、それぞれ 1 回の実験で成功するまでに観測された失敗回数を表します。geornd を使用して、幾何分布から乱数を生成します。たとえば、以下では成功確率 p が 0.1 になる幾何分布から乱数を生成します。

p = 0.1;
r = geornd(p)
r = 1

返された乱数は、一連の独立試行で成功するまでに観測された失敗の数を表します。

他の分布との関係

幾何分布は、負の二項分布の特殊なケースで、成功パラメーター r の回数が 1 に等しく指定されます。

累積分布関数

定義

幾何分布の cdf (累積分布関数) は次のようになります。

y=F(x|p)=1(1p)x+1;x=0,1,2,...,

p は成功の確率で、x は最初に成功するまでに失敗した回数です。結果 y は、任意の試行の成功確率が p のときに、成功するまでに最大 x 回の試行を観測する確率です。

プロット

このプロットは、パラメーター p の値の変化が、累積分布関数の形状にどのような変化を与えるかを示しています。geocdf を使用して、3 つの異なる p 値について、1 から 10 までの x 値の累積分布関数を計算します。次に、3 つすべての累積分布関数を同じ図にプロットし、視覚的に比較します。

x = [1:10];
y1 = geocdf(x,0.1);   % For p = 0.1
y2 = geocdf(x,0.25);  % For p = 0.25
y3 = geocdf(x,0.75);  % For p = 0.75

figure;
plot(x,y1,'kd')
hold on
plot(x,y2,'ro')
plot(x,y3,'b+')
legend({'p = 0.1','p = 0.25','p = 0.75'})
hold off

このプロットでの y の値は、成功するまでに最大 x 回の試行を観測する確率です。成功確率 p が高いと、x が増加するにつれて y も急速に増加します。試行回数が少なくても、成功を観測する確率は急速に高くなります。しかし、成功確率 p が低い場合、x の増加につれ、y もゆっくりと増加します。成功を観測する確率は、試行回数が増加するにつれて増加しますが、速度ははるかに遅くなります。

累積分布逆関数

幾何分布の累積分布逆関数は、独立試行で連続 x 回の成功を観測する確率 y に対応する x の値を決定します。geoinv を使用して幾何分布の累積分布逆関数を計算します。たとえば、以下では、各独立試行 p の成功確率が 0.03 の場合、x で評価される幾何累積分布関数 y が 0.1 以上であるような可能な最小の整数 x を返します。

y = 0.1;
p = 0.03;
x = geoinv(y,p)
x = 3

平均と分散

幾何分布の平均は以下のとおりです。

mean=1pp,

また幾何分布の分散は以下のようになります。

var=1pp2,

ここで p は成功の確率です。

geostat を使用して、幾何分布の平均と分散を計算します。たとえば、以下では、確率パラメーター p が 0.25 になる幾何分布の平均 m と分散 v を計算します。

p = 0.25;
[m,v] = geostat(p)
m = 3
v = 12

幾何分布の確率の計算

使用期間が 5 年の自動車のバッテリーが、寒い気候で機能しない確率は 0.03 であると仮定します。寒い期間に 25 日続けて自動車のエンジンがかかる確率はどのくらいでしょうか。

幾何分布を使用して、状況をモデル化します。ここで、"失敗" は自動車のエンジンがかかることを、"成功" は自動車のエンジンがかからないことを意味します。成功 (エンジンがかからない) が 1 回も観測されずに 25 回の失敗 (エンジンがかかる) が観測される確率を求めます。各試行において成功する (1 回の試行で自動車のエンジンがかからない) 確率 p は 0.03 です。

x が 25 に等しい場合の累積分布関数 (cdf) を計算します。これにより、最大 25 回の試行で成功 (自動車のエンジンがかからない) が観測される確率が得られます。

x = 25;
p = 0.03;
psuccess = geocdf(x,p);

25 回の試行で成功が観測されない確率、つまり、25 回の試行のすべてで自動車のエンジンがかかる確率を求めるため、この結果を 1 から減算します。

pfail = 1 - psuccess
pfail = 0.4530

返された結果 pfail = 0.4530 は、寒い期間に 25 日間続けて自動車のエンジンがかかる確率です。

cdf プロットから、試行回数 (x) が増加すると、成功する確率 (y) も上昇することがわかります。この例では、自動車のエンジンをかける試行回数が多いほど、そのうち少なくとも 1 回は失敗する確率が高くなることを意味します。

figure;
x = 0:25;
y = geocdf(x,0.03);
stairs(x,y)

参考

| | | | |

関連するトピック