ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

ベータ分布

概要

ベータ分布は、(0 1) 区間でのみゼロでないという性質をもつ曲線群として表されます。関数のより一般的なものは、区間の両端にパラメーターを割り当てるものです。

Statistics and Machine Learning Toolbox™ には、ベータ分布を操作する方法がいくつか用意されています。次のアプローチを使用して、標本データからのパラメーターの推定、pdf、cdf および icdf の計算、乱数の生成などを行うことができます。

  • 確率分布オブジェクトで標本データを近似するか、パラメーター値を指定して確率分布オブジェクトを作成する。詳細は、Using BetaDistribution Objects を参照してください。

  • 確率密度関数を使用して、行列、テーブル およびデータセット配列から入力したデータを操作する。ベータ分布関数の一覧については、サポートされている分布を参照してください。

  • アプリまたはユーザー インターフェイスを使用して対話的に分布から乱数を生成、近似、調査および生成する。

これらの各オプションについての詳細は、確率分布の操作を参照してください。

パラメーター

ベータ分布は、次のパラメーターを使用します。

パラメーター説明サポート
a最初の形状パラメーターa>0
b2 番目の形状パラメーターb>0

確率密度関数

定義

ベータ関数の確率密度関数 (pdf) は次のようになります。

y=f(x|a,b)=1B(a,b)xa1(1x)b1I[0,1](x)

ここで、B( · ) はベータ関数です。インジケーター関数 I(0,1)(x) は、x の値が (0,1) の範囲にある場合のみ非ゼロの確率になることを保証します。

プロット

このプロットは、パラメーターの値を変更すると pdf の形状がどのように変化するかを示しています。一定値の確率密度関数 (平らな線) をもつ標準一様分布は、a = b = 1 で発生した場合、ベータ分布の特別な場合であることを示しています。

X = 0:.01:1;
y1 = betapdf(X,0.75,0.75);
y2 = betapdf(X,1,1);
y3 = betapdf(X,4,4);

figure
plot(X,y1,'Color','r','LineWidth',2)
hold on
plot(X,y2,'LineStyle','-.','Color','b','LineWidth',2)
plot(X,y3,'LineStyle',':','Color','g','LineWidth',2)
legend({'a = b = 0.75','a = b = 1','a = b = 4'},'Location','NorthEast');
hold off

他の分布との関係

ベータ分布は、t 分布と機能的に関係があります。Y が自由度 ν のスチューデントの t 分布からの観測値である場合、次の変換はベータ分布する X を生成します。

X=12+12Yν+Y2

Y~t(v) の場合、Xβ(ν2,ν2) になります。

t 分布する乱数を生成する場合や t 累積分布関数と逆関数の値を計算する場合にこの関係が使用されます。

累積分布関数

ベータ累積分布関数は、不完全ベータ関数と同じです。

下限 0、上限 1 をもつデータを収集していると仮定します。パラメーター推定は、このデータに最も良く近似したベータ分布のパラメーターを決定するプロセスです。

値の適合度合の規範として、一般的なものの 1 つは、尤度関数を最大にすることです。尤度は、上記のベータ確率密度関数と同じ型をしています。しかし、確率密度関数において、パラメーターは既知の定数であり、変数は x です。尤度関数は、この関係が逆になります。この場合、標本値 (x の値) は、既に観測されています。それらの値は、固定された定数です。変数は未知パラメーターです。最尤推定法 (MLE) は、あるデータ集合に対して、最尤を与えるパラメーター値を計算します。

関数 betafit は、ベータ分布のパラメーターについて、最尤推定と信頼区間を出力します。ここでは、a = 5b = 0.2 のベータ分布からの乱数を使った例を示します。

rng default  % For reproducibility
r = betarnd(5,0.2,100,1);
[phat, pci] = betafit(r)
phat = 1×2

    7.4911    0.2135

pci = 2×2

    5.0861    0.1744
   11.0334    0.2614

パラメーター a の最尤推定量は 7.4911 ですが、真の値は 5 です。a の 95% 信頼区間は 5.0861 から 11.0334 までであり、真の値が含まれていません。この結果の発生する確率は高くありませんが、分布パラメーターの評価時など、場合によっては発生します。

同様に、パラメーター b の真の値が 0.2 であるのに対して、最尤推定値は 0.2135 です。b の 95% 信頼区間は 0.1744 から 0.2614 で、真の値が含まれます。この架空の例では「真の値」が既知ですが、実験では不明です。

参考

関連するトピック