多項分布
概要
多項分布は、一連の独立試行の中で成功となる各組み合わせの確率をモデル化します。試行ごとに、相互に排他的な結果が 2 つより多く存在し、それぞれの結果の成功確率が固定の場合、この分布を使用します。
パラメーター
多項分布は、次のパラメーターを使用します。
パラメーター | 説明 | 制約 |
---|---|---|
probabilities | 結果の確率 |
確率密度関数
多項分布の確率密度関数は、次の式で表されます。
ここで、k は試行ごとに、相互に排他的な結果の数で、n は試行の総数です。ベクトル x = (x1...xk) は、k 結果ごとの観測数で、合計が n になる非負の整数成分を含んでいます。ベクトル p = (p1...pk) は、k 結果ごとの固定確率で、合計が 1 になる非負のスカラー成分を含んでいます。
記述統計
n 回の試行で結果 i が観測される期待数は次のようになります。
ここで、pi は結果 i の固定確率です。
結果 i の分散は次のようになります。
結果 i および j の共分散は次のようになります。
他の分布との関係
多項分布は、二項分布 の汎化です。二項分布は、2 つの結果をもつ過程を n 回独立試行した場合に "成功" する回数の確率を示し、多項分布は、結果が k 個である過程を n 回独立試行した結果の、それぞれの組み合わせの確率を示します。任意の 1 回の試行での結果の確率は、それぞれ、一定の確率 p1, ..., pk で与えられます。