メインコンテンツ

ピアソン分布

ピアソン分布は 4 パラメーターの分布です。任意の平均、標準偏差、歪度、および尖度をもちます。この分布は、外れ値になりやすい非対称データのモデル化によく使用されます。

Statistics and Machine Learning Toolbox™ には、ピアソン分布を処理する方法がいくつか用意されています。

  • makedist を使用してパラメーター値を指定することにより、確率分布オブジェクト PearsonDistribution を作成します。そして、オブジェクト関数を使用して、分布の評価や乱数の生成などを行います。

  • 分布パラメーターを指定して、分布特有の関数 (pearspdfpearscdfpearsrndpearsinv) を使用します。分布特有の関数では、複数のピアソン分布についてのパラメーターを受け入れることができます。

  • 分布名 "Pearson" と分布パラメーターを指定するか、分布オブジェクト PearsonDistribution を使用して、汎用の分布関数 (cdfpdfrandomicdf) を使用します。

タイプ

ピアソン分布には 8 つのタイプがあり、そのほとんどは既知の他の分布に対応します。

ピアソン分布のタイプ説明
0正規
14 パラメーター ベータ
2対称 4 パラメーター ベータ
33 パラメーター ガンマ
4pdf が (1+(xμσ)2)aexp(barctan(xμσ)) に比例するピアソン システム特有の分布 (ab はピアソン分布を定義する微分方程式に関係する量)
5逆 3 パラメーター ガンマ
6"F" 位置-スケール
7スチューデントの "F" 位置-スケール

パラメーター

ピアソン分布では、次のパラメーターを使用します。

パラメーター説明
μ平均
σ標準偏差
γ歪度。γ は標本の平均値周りのデータの非対称性を示す尺度です。歪度が負である場合、データは平均値の右側よりも左側に大きく広がります。歪度が正である場合、データは右側に大きく広がります。γ2κ – 1 未満でなければなりません。
κ尖度。κ は分布が外れ値になる傾向を示す尺度です。正規分布の尖度は 3 です。正規分布より外れ値になりやすい分布では尖度の値が 3 より大きくなり、なりにくい分布では尖度の値が 3 より小さくなります。κγ2 + 1 より大きくなければなりません。

確率密度関数

ピアソン分布の確率密度関数 (pdf) は次の微分方程式の解です。

p'(x)p(x)=a+(xμ)b0+b1(xμ)+b2(xμ)2,

この方程式は係数 bj (0 ≤ j ≤ 2) で定義されます。ほとんどの分布タイプでは、pdf は閉形式の関数です。次の表に、各分布タイプの pdf を示します。

ピアソン分布のタイプpdf p(x)
0

1σ2πe(xμ)22σ2

1(xlb)a1(ubx)b1B(a,b)(ublb)a+b1 (Bベータ関数lbub はそれぞれ分布の下限と上限、a > 0 は形状パラメーター、b > 0 はスケール パラメーター)
2(x+ub)a1(ubx)b1B(a,b)(2ub)a+b1
31baΓ(a)(xlb)a1exlbb (Γガンマ関数)
4|Γ(m+ν2i)Γ(m)|2σB(m12,12)[1+u2]mexp[νarctan(u)],u=xμσ (m > 0ν > 0 は形状パラメーター)
5baebuσua+1Γ(a),u=xμσ
61σΓ[(ν1+ν2)2]Γ(ν12)Γ(ν22)(ν1ν2)ν12uν122[1+(ν1ν2)u](ν1+ν2)2,u=xμσ (ν1 > 0ν2 > 0 は形状パラメーター)
7Γ(ν+12)σνπΓ(ν2)[ν+u2ν](ν+12),u=xμσ

累積分布関数

ピアソン分布の累積分布関数 (cdf) は pdf の積分です。次の表に、各分布タイプの cdf を示します。

ピアソン分布のタイプcdf c(x)
01σ2πxe(tμ)22σ2dt
11B(a,b)(ublb)a+b1lbx(tlb)a1(ubt)b1dt (Bベータ関数lbub はそれぞれ分布の下限と上限、a > 0 は形状パラメーター、b > 0 はスケール パラメーター)
2

1B(a,b)(2ub)a+b1ubx(t+ub)a1(ubt)b1dt

31bΓ(a)lbx(tlb)a1etlbbdt
4タイプ 4 のピアソン分布には閉形式の cdf はありません。タイプ 4 のピアソン分布の点 x における cdf は、pdf を –∞ から x まで数値的に積分することで評価できます。cdf の評価には pearscdf または cdf を使用します。
5Q(a,bu),u=xμσ (Q不完全ガンマ関数)
6Iν1u/(ν1u+ν2)(ν12,ν22),u=xμσ (I は正則化された不完全ベータ関数、ν1 > 0ν2 > 0 は形状パラメーター)
7xΓ(ν+12)Γ(ν2)1σνπ1(1+t2ν)ν+12dt (ν > 0 は形状パラメーター)

サポート

一部のピアソン分布のタイプでは、pdf を定義する微分方程式の係数 bj によって pdf と cdf に対するサポートが与えられます。次の表に、ピアソン分布の pdf と cdf に対する μ = 0 および σ = 1 の場合のサポートを示します。変数 a1a2 は方程式 b0+b1(xμ)+b2(xμ)2=0 の解であり、a1 < a2 です。

ピアソン分布のタイプサポート
0(-Inf,Inf)
1(a1,a2)
2(-a1,a1)
3a>0 の場合は (a1,Inf)a<0 の場合は (-Inf,a1)
4(-Inf,Inf)
5(b1-C1)/b2 <0 の場合は (-C1,Inf)、それ以外の場合は (-Inf,C1)C1 = b1/(2*b2)
6a1a2 が負の場合は (a2,Inf)a1a2 が正の場合は (-Inf,a1)
7(-Inf,Inf)

μ ≠ 0 または σ ≠ 1 の分布の場合は、前の表で与えられる範囲からサポートの範囲がシフトします。この場合、下限 lb と上限 ub を次のように計算できます。

  • lb = σlb*

  • ub = σub*

ここで、lb*ub* は、前の表で同じ分布タイプに対して与えられている下限と上限です。

ピアソン分布の比較

タイプ 0 のピアソン分布のパラメーターを格納する変数 mu0sigma0skew0、および kurt0 を作成します。

mu0 = 0;
sigma0 = 1;
skew0 = 0;
kurt0 = 3;

pearspdf関数とpearscdf関数を使用して、タイプ 0 のピアソン分布の –5 から 5 までの範囲の pdf と cdf をそれぞれ評価します。linspace関数を使用して –5 から 5 までの範囲の点のベクトルを作成できます。mu0sigma0skew0、および kurt0 によってタイプ 0 のピアソン分布が定義されることを確認します。

x0 = linspace(-5,5,100);
[p0,type0] = pearspdf(x0,mu0,sigma0,skew0,kurt0);
c0 = pearscdf(x0,mu0,sigma0,skew0,kurt0);
type0
type0 = 
0

出力から、p0 にタイプ 0 のピアソン分布 (標準正規分布) の pdf が格納されていることがわかります。

pearsrnd関数を使用して、分布から無作為な点の標本を抽出します。

rng(0,"twister") % For reproducibility
r0 = pearsrnd(mu0,sigma0,skew0,kurt0,[100,1]);

このプロセスをタイプ 4 のピアソン分布について繰り返します。変数 mu4sigma4skew4、および kurt4 を定義します。–5 から 15 までの範囲の pdf と cdf を評価し、分布から無作為標本を抽出します。

mu4 = 5;
sigma4 = 1;
skew4 = 1;
kurt4 = 10;
x4 = linspace(-5,15,100);
[p4,type4] = pearspdf(x4,mu4,sigma4,skew4,kurt4);
c4 = pearscdf(x4,mu4,sigma4,skew4,kurt4);
r4 = pearsrnd(mu4,sigma4,skew4,kurt4,[100,1]);

mu4sigma4skew4、および kurt4 によってタイプ 4 のピアソン分布が定義されることを確認します。

type4
type4 = 
4

このプロセスをタイプ 6 のピアソン分布について繰り返し、–10 から 10 までの範囲の pdf と cdf を評価します。

mu6 = 0;
sigma6 = 5;
skew6 = 3;
kurt6 = 20;
x6 = linspace(-10,10,100);
[p6,type6] = pearspdf(x6,mu6,sigma6,skew6,kurt6);
c6 = pearscdf(x6,mu6,sigma6,skew6,kurt6);
r6 = pearsrnd(mu6,sigma6,skew6,kurt6,[100,1]);

mu6sigma6skew6、および kurt6 によってタイプ 6 のピアソン分布が定義されることを確認します。

type6
type6 = 
6

tiledlayout関数とnexttile関数を使用して、タイプ 0、4、6 のピアソン分布の無作為標本、pdf、および cdf の箱ひげ図を表示します。boxchart関数を使用して無作為標本の箱ひげ図を作成します。

tiledlayout(3,3)
nexttile
boxchart(r0)
title("Random Sample")
ylabel("Type 0",FontWeight="bold")
nexttile
plot(x0,p0)
title("PDF")
nexttile
plot(x0,c0)
title("CDF")
nexttile
boxchart(r4)
ylabel("Type 4",FontWeight="bold")
nexttile
plot(x4,p4)
nexttile
plot(x4,c4)
nexttile
boxchart(r6)
ylabel("Type 6",FontWeight="bold")
nexttile
plot(x6,p6)
nexttile
plot(x6,c6)

Figure contains 9 axes objects. Axes object 1 with title Random Sample, ylabel Type 0 contains an object of type boxchart. Axes object 2 with title PDF contains an object of type line. Axes object 3 with title CDF contains an object of type line. Axes object 4 with ylabel Type 4 contains an object of type boxchart. Axes object 5 contains an object of type line. Axes object 6 contains an object of type line. Axes object 7 with ylabel Type 6 contains an object of type boxchart. Axes object 8 contains an object of type line. Axes object 9 contains an object of type line.

Figure の行は、ピアソン分布の 3 つのタイプに対応します。1 列目に各分布の無作為標本の箱ひげ図があります。タイプ 6 のピアソン分布は外れ値の数が最も多く、これは 3 つの分布のうちで尖度が最も大きいことと一致しています。2 列目に各分布の pdf のプロットがあります。タイプ 0 とタイプ 4 のピアソン分布は pdf が非有界であり、タイプ 6 のピアソン分布には下限があります。3 列目は各分布の cdf のプロットを示しています。タイプ 0 とタイプ 4 のピアソン分布は pdf の形状が似ているため、cdf は似たような S 字型になります。タイプ 6 のピアソン分布の cdf は下限よりも大きい値について凹になります。

タイプ 6 のピアソン分布の下限を計算するには、ピアソン分布の pdf を定義する常微分方程式の分母にある多項式の係数を返します。詳細については、確率密度関数およびサポートを参照してください。

[~,~,coefs6] = pearspdf([],mu6,sigma6,skew6,kurt6)
coefs6 = 1×3

    0.7162    0.9324    0.0946

係数は左から右の順に昇順に並んだ項に対応します。

roots関数を使用して多項式関数の根を求めます。fliplr関数を使用して、係数が左から右の順に降順に並んだ項に対応するように coefs6 の形式を設定します。

coefs6 = fliplr(coefs6);
roots6 = roots(coefs6)
roots6 = 2×1

   -9.0175
   -0.8396

多項式の根が負であり、タイプ 6 のピアソン分布の pdf に下限があることを示しています。

下限を計算するには、最も大きい根に sigma6 を乗算し、その結果を mu6 に加算します。

lb6 = sigma6*max(roots6) + mu6
lb6 = 
-4.1982

タイプ 6 のピアソン分布の pdf はサポートの下限が約 –4 で、これは pdf のプロットと一致しています。

参照

[1] Johnson, Norman Lloyd, et al. "Continuous Univariate Distributions." 2nd ed, vol. 1, Wiley, 1994.

[2] Willink, R. "A Closed-Form Expression for the Pearson Type IV Distribution Function." Australian & New Zealand Journal of Statistics, vol. 50, no. 2, June 2008, pp. 199–205. https://onlinelibrary.wiley.com/doi/10.1111/j.1467-842X.2008.00508.x

参考

| | | | | | | | |

トピック