ピアソン分布
ピアソン分布は 4 パラメーターの分布です。任意の平均、標準偏差、歪度、および尖度をもちます。この分布は、外れ値になりやすい非対称データのモデル化によく使用されます。
Statistics and Machine Learning Toolbox™ には、ピアソン分布を処理する方法がいくつか用意されています。
makedistを使用してパラメーター値を指定することにより、確率分布オブジェクトPearsonDistributionを作成します。そして、オブジェクト関数を使用して、分布の評価や乱数の生成などを行います。分布パラメーターを指定して、分布特有の関数 (
pearspdf、pearscdf、pearsrnd、pearsinv) を使用します。分布特有の関数では、複数のピアソン分布についてのパラメーターを受け入れることができます。分布名
"Pearson"と分布パラメーターを指定するか、分布オブジェクトPearsonDistributionを使用して、汎用の分布関数 (cdf、pdf、random、icdf) を使用します。
タイプ
ピアソン分布には 8 つのタイプがあり、そのほとんどは既知の他の分布に対応します。
| ピアソン分布のタイプ | 説明 |
|---|---|
0 | 正規 |
1 | 4 パラメーター ベータ |
2 | 対称 4 パラメーター ベータ |
3 | 3 パラメーター ガンマ |
4 | pdf が に比例するピアソン システム特有の分布 (a と b はピアソン分布を定義する微分方程式に関係する量) |
5 | 逆 3 パラメーター ガンマ |
6 | "F" 位置-スケール |
7 | スチューデントの "F" 位置-スケール |
パラメーター
ピアソン分布では、次のパラメーターを使用します。
| パラメーター | 説明 |
|---|---|
| μ | 平均 |
| σ | 標準偏差 |
| γ | 歪度。γ は標本の平均値周りのデータの非対称性を示す尺度です。歪度が負である場合、データは平均値の右側よりも左側に大きく広がります。歪度が正である場合、データは右側に大きく広がります。γ2 が κ – 1 未満でなければなりません。 |
| κ | 尖度。κ は分布が外れ値になる傾向を示す尺度です。正規分布の尖度は 3 です。正規分布より外れ値になりやすい分布では尖度の値が 3 より大きくなり、なりにくい分布では尖度の値が 3 より小さくなります。κ は γ2 + 1 より大きくなければなりません。 |
確率密度関数
ピアソン分布の確率密度関数 (pdf) は次の微分方程式の解です。
この方程式は係数 (0 ≤ j ≤ 2) で定義されます。ほとんどの分布タイプでは、pdf は閉形式の関数です。次の表に、各分布タイプの pdf を示します。
| ピアソン分布のタイプ | pdf p(x) |
|---|---|
0 | |
1 | (B はベータ関数、lb と ub はそれぞれ分布の下限と上限、a > 0 は形状パラメーター、b > 0 はスケール パラメーター) |
2 | |
3 | (Γ はガンマ関数) |
4 | (m > 0 と ν > 0 は形状パラメーター) |
5 | |
6 | (ν1 > 0 と ν2 > 0 は形状パラメーター) |
7 |
累積分布関数
ピアソン分布の累積分布関数 (cdf) は pdf の積分です。次の表に、各分布タイプの cdf を示します。
| ピアソン分布のタイプ | cdf c(x) |
|---|---|
0 | |
1 | (B はベータ関数、lb と ub はそれぞれ分布の下限と上限、a > 0 は形状パラメーター、b > 0 はスケール パラメーター) |
2 | |
3 | |
4 | タイプ 4 のピアソン分布には閉形式の cdf はありません。タイプ 4 のピアソン分布の点 x における cdf は、pdf を –∞ から x まで数値的に積分することで評価できます。cdf の評価には pearscdf または cdf を使用します。 |
5 | (Q は不完全ガンマ関数) |
6 | (I は正則化された不完全ベータ関数、ν1 > 0 と ν2 > 0 は形状パラメーター) |
7 | (ν > 0 は形状パラメーター) |
サポート
一部のピアソン分布のタイプでは、pdf を定義する微分方程式の係数 によって pdf と cdf に対するサポートが与えられます。次の表に、ピアソン分布の pdf と cdf に対する μ = 0 および σ = 1 の場合のサポートを示します。変数 a1 と a2 は方程式 の解であり、a1 < a2 です。
| ピアソン分布のタイプ | サポート |
|---|---|
0 | (-Inf,Inf) |
1 | (a1,a2) |
2 | (-a1,a1) |
3 | a>0 の場合は (a1,Inf)、a<0 の場合は (-Inf,a1) |
4 | (-Inf,Inf) |
5 | (b1-C1)/b2 <0 の場合は (-C1,Inf)、それ以外の場合は (-Inf,C1)。C1 = b1/(2*b2)。 |
6 | a1 と a2 が負の場合は (a2,Inf)、a1 と a2 が正の場合は (-Inf,a1) |
7 | (-Inf,Inf) |
μ ≠ 0 または σ ≠ 1 の分布の場合は、前の表で与えられる範囲からサポートの範囲がシフトします。この場合、下限 lb と上限 ub を次のように計算できます。
lb = σlb*+μ
ub = σub*+μ
ここで、lb* と ub* は、前の表で同じ分布タイプに対して与えられている下限と上限です。
例
ピアソン分布の比較
タイプ 0 のピアソン分布のパラメーターを格納する変数 mu0、sigma0、skew0、および kurt0 を作成します。
mu0 = 0; sigma0 = 1; skew0 = 0; kurt0 = 3;
pearspdf関数とpearscdf関数を使用して、タイプ 0 のピアソン分布の –5 から 5 までの範囲の pdf と cdf をそれぞれ評価します。linspace関数を使用して –5 から 5 までの範囲の点のベクトルを作成できます。mu0、sigma0、skew0、および kurt0 によってタイプ 0 のピアソン分布が定義されることを確認します。
x0 = linspace(-5,5,100); [p0,type0] = pearspdf(x0,mu0,sigma0,skew0,kurt0); c0 = pearscdf(x0,mu0,sigma0,skew0,kurt0); type0
type0 = 0
出力から、p0 にタイプ 0 のピアソン分布 (標準正規分布) の pdf が格納されていることがわかります。
pearsrnd関数を使用して、分布から無作為な点の標本を抽出します。
rng(0,"twister") % For reproducibility r0 = pearsrnd(mu0,sigma0,skew0,kurt0,[100,1]);
このプロセスをタイプ 4 のピアソン分布について繰り返します。変数 mu4、sigma4、skew4、および kurt4 を定義します。–5 から 15 までの範囲の pdf と cdf を評価し、分布から無作為標本を抽出します。
mu4 = 5; sigma4 = 1; skew4 = 1; kurt4 = 10; x4 = linspace(-5,15,100); [p4,type4] = pearspdf(x4,mu4,sigma4,skew4,kurt4); c4 = pearscdf(x4,mu4,sigma4,skew4,kurt4); r4 = pearsrnd(mu4,sigma4,skew4,kurt4,[100,1]);
mu4、sigma4、skew4、および kurt4 によってタイプ 4 のピアソン分布が定義されることを確認します。
type4
type4 = 4
このプロセスをタイプ 6 のピアソン分布について繰り返し、–10 から 10 までの範囲の pdf と cdf を評価します。
mu6 = 0; sigma6 = 5; skew6 = 3; kurt6 = 20; x6 = linspace(-10,10,100); [p6,type6] = pearspdf(x6,mu6,sigma6,skew6,kurt6); c6 = pearscdf(x6,mu6,sigma6,skew6,kurt6); r6 = pearsrnd(mu6,sigma6,skew6,kurt6,[100,1]);
mu6、sigma6、skew6、および kurt6 によってタイプ 6 のピアソン分布が定義されることを確認します。
type6
type6 = 6
tiledlayout関数とnexttile関数を使用して、タイプ 0、4、6 のピアソン分布の無作為標本、pdf、および cdf の箱ひげ図を表示します。boxchart関数を使用して無作為標本の箱ひげ図を作成します。
tiledlayout(3,3) nexttile boxchart(r0) title("Random Sample") ylabel("Type 0",FontWeight="bold") nexttile plot(x0,p0) title("PDF") nexttile plot(x0,c0) title("CDF") nexttile boxchart(r4) ylabel("Type 4",FontWeight="bold") nexttile plot(x4,p4) nexttile plot(x4,c4) nexttile boxchart(r6) ylabel("Type 6",FontWeight="bold") nexttile plot(x6,p6) nexttile plot(x6,c6)

Figure の行は、ピアソン分布の 3 つのタイプに対応します。1 列目に各分布の無作為標本の箱ひげ図があります。タイプ 6 のピアソン分布は外れ値の数が最も多く、これは 3 つの分布のうちで尖度が最も大きいことと一致しています。2 列目に各分布の pdf のプロットがあります。タイプ 0 とタイプ 4 のピアソン分布は pdf が非有界であり、タイプ 6 のピアソン分布には下限があります。3 列目は各分布の cdf のプロットを示しています。タイプ 0 とタイプ 4 のピアソン分布は pdf の形状が似ているため、cdf は似たような S 字型になります。タイプ 6 のピアソン分布の cdf は下限よりも大きい値について凹になります。
タイプ 6 のピアソン分布の下限を計算するには、ピアソン分布の pdf を定義する常微分方程式の分母にある多項式の係数を返します。詳細については、確率密度関数およびサポートを参照してください。
[~,~,coefs6] = pearspdf([],mu6,sigma6,skew6,kurt6)
coefs6 = 1×3
0.7162 0.9324 0.0946
係数は左から右の順に昇順に並んだ項に対応します。
roots関数を使用して多項式関数の根を求めます。fliplr関数を使用して、係数が左から右の順に降順に並んだ項に対応するように coefs6 の形式を設定します。
coefs6 = fliplr(coefs6); roots6 = roots(coefs6)
roots6 = 2×1
-9.0175
-0.8396
多項式の根が負であり、タイプ 6 のピアソン分布の pdf に下限があることを示しています。
下限を計算するには、最も大きい根に sigma6 を乗算し、その結果を mu6 に加算します。
lb6 = sigma6*max(roots6) + mu6
lb6 = -4.1982
タイプ 6 のピアソン分布の pdf はサポートの下限が約 –4 で、これは pdf のプロットと一致しています。
参照
[1] Johnson, Norman Lloyd, et al. "Continuous Univariate Distributions." 2nd ed, vol. 1, Wiley, 1994.
[2] Willink, R. "A Closed-Form Expression for the Pearson Type IV Distribution Function." Australian & New Zealand Journal of Statistics, vol. 50, no. 2, June 2008, pp. 199–205. https://onlinelibrary.wiley.com/doi/10.1111/j.1467-842X.2008.00508.x
参考
pearspdf | pearscdf | pearsrnd | pearsinv | pdf | cdf | random | icdf | skewness | kurtosis