ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

二項分布

概要

二項分布は、下記の条件のもとで、無限大の母集団の中から繰り返し試行での成功回数を表しています。

  • n 回試行したそれぞれの結果は 2 通りしかありえません。

  • それぞれの試行での成功の確率が一定である。

  • すべての試行は、互いに独立している。

パラメーター

二項分布は、次のパラメーターを使用します。

パラメーター説明サポート
N試行回数正の整数
p成功確率0p1

確率密度関数

確率密度関数 (pdf) は次のようになります。

f(x|N,p)=(Nx)px(1p)Nx;x=0,1,2,...,N,

ここで x は、成功確率が p であるベルヌーイ過程を n 回試行した場合の成功数です。

平均と分散

平均は次のようになります。

mean=np.

分散は次のようになります。

var=np(1p).

他の分布との関係

二項分布はベルヌーイ分布の汎化であり、1 より大きい n 回の試行が許容されます。試行ごとに潜在的な結果が 3 つ以上ある場合は、二項分布を一般化した多項分布になります。

ある製品の製造工程からデータを収集し、100 個ずつのグループについて仕様範囲内にある製品の数を記録するとします。個々の製品が仕様範囲内になる確率は、どのようになるでしょう。
パラメーター推定は、ある意味で、最も適したデータを割り当てる二項分布のパラメーター p を決める過程です。

値の適合度合の規範として、一般的なものの 1 つは、尤度関数を最大にすることです。尤度は上記の二項確率密度関数と同じ型をしています。しかし、確率密度関数において、パラメーター (np) は既知の定数であり、変数は x です。尤度関数は、この関係が逆になります。この場合、標本値 (x の値) は、既に観測されています。それらの値は、固定された定数です。変数は未知パラメーターです。最尤推定 (MLE) は、特定のデータ集合が与えられると、最尤値を与える p 値の計算を行います。

関数 binofit は、二項分布のパラメーターの最尤推定と信頼区間を出力します。これは、n = 100、 p = 0.9 である二項分布から発生させた乱数を使った例です。

rng default;  % for reproducibility
r = binornd(100,0.9)
r = 85
[phat, pci] = binofit(r,100)
phat = 0.8500
pci = 1×2

    0.7647    0.9135

パラメーター p の最尤推定値は 0.8800 であり、真の値は 0.9 です。p の 95% 信頼区間は 0.7998 ~ 0.9364 であり、真の値が含まれています。この例では、p の "真の値" を知ることができます。実験では知ることはできません。

次のコマンドは、n = 10 と p = 1/2 の二項分布の確率密度関数のプロットを生成します。

x = 0:10;
y = binopdf(x,10,0.5);
plot(x,y,'+')

参考

関連するトピック