ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

一般化極値分布

定義

位置パラメーター µ と スケール パラメーター σ、および形状パラメーター k0 をもつ一般化極値分布に対する確率密度関数は、次の式で表されます。

y=f(x|k,μ,σ)=(1σ)exp((1+k(xμ)σ)1k)(1+k(xμ)σ)11k

これは次の場合です。

1 + k(x-μ)σ > 0

k > 0 は、タイプ II の場合に対応し、k < 0 はタイプ III の場合に対応します。k = 0 ではタイプ I の場合に対応し、密度は次のようになります。

y=f(x|0,μ,σ)=(1σ)exp(exp((xμ)σ)(xμ)σ)

背景

極値分布のように、一般化極値分布は、測定値や観測値を表す互いに独立で同一の分布に従う乱数の大きな集合における最小値あるいは最大値をモデリングするために使用されることが多くあります。たとえば、製造工程からの 1000 のワッシャーがあるものとします。各バッチの最大のワッシャーのサイズを記録すると、データはブロックの最大 (あるいは、最小を記録する場合は最小) であることがわかっています。これらのブロックの最大に対するモデルとして、一般化極値分布を使用できます。

一般化極値分布は、より簡単な 3 つの分布を 1 つの形にまとめます。この場合、これらのより簡単な 3 つの分布すべてを含む可能な形状を連続的にとることができます。これらの分布のいずれかを使用して、ブロック最大の特定のデータセットをモデル化できます。一般化極値分布により、どの分布が適切であるかを "データに決めさせる" ことができます。

一般化極値分布によってカバーされた 3 つのケースは、タイプ I、II、III と呼ばれることがしばしばあります。それぞれのタイプは、基準となる異なるクラスの分布から派生したブロック最大の極限分布に該当します。正規分布のように、裾が指数減衰する分布は、タイプ I になります。スチューデントの t 分布のように、裾が多項式のように減衰する分布は、タイプ II になります。分布の裾が有限の場合は、タイプ III になります。

タイプ I、II、III は、多少紛らわしい用語かもしれませんが、Gumbel、Frechet、Weibull タイプと呼ばれることもあります。タイプ I (Gumbel) とタイプ III (Weibull) の場合は、たとえば、それぞれ、関数 evcdfevfit、または wblcdfwblfit によって計算されるように、実際は、通常の Gumbel および Weibull 分布の鏡像に相当します。最後に、タイプ II (Frechet) の場合は、標準の Weibull 分布からの値の逆数をとることに相当します。

パラメーター

自由度 5 のスチューデントの t 分布から取り出された 1000 個の乱数値からなる 250 ブロックを作成し、それぞれから最大値をとる場合、これらの最大値を一般化極値分布で近似できます。

blocksize = 1000;
nblocks = 250;
rng default  % For reproducibility
t = trnd(5,blocksize,nblocks);
x = max(t); % 250 column maxima
paramEsts = gevfit(x)
paramEsts =

    0.1185    1.4530    5.8929

スチューデントの t 分布からのブロックそれぞれの最大に基づいて求める形状パラメーターの推定 (最初の要素) が、正であることに注意してください。

hist(x,2:20);
h = findobj(gca,'Type','patch');
h.FaceColor = [.8 .8 1];
xgrid = linspace(2,20,1000);
line(xgrid,nblocks*...
     gevpdf(xgrid,paramEsts(1),paramEsts(2),paramEsts(3)));

一般化極値分布の確率密度関数の計算

一般化極値分布の 3 つの基本的な形式に対する確率密度関数の例を作成します。

x = linspace(-3,6,1000);
y1 = gevpdf(x,-.5,1,0);
y2 = gevpdf(x,0,1,0);
y3 = gevpdf(x,.5,1,0);
plot(x,y1,'-', x,y2,'--', x,y3,':')
legend({'K < 0, Type III' 'K = 0, Type I' 'K > 0, Type II'})

k = 0 の場合、分布の x の確率密度は 0 になり、 $x < -\sigma/k + \mu$ となります。

k = 0 の場合、 $x &gt; -\sigma/k + \mu$ で分布の確率密度が 0 になります。

k = 0 の場合、上限と下限はありません。

一般化極値分布の確率密度関数の計算

一般化極値分布の 3 つの基本的な形式に対する確率密度関数の例を作成します。

x = linspace(-3,6,1000);
y1 = gevpdf(x,-.5,1,0);
y2 = gevpdf(x,0,1,0);
y3 = gevpdf(x,.5,1,0);
plot(x,y1,'-', x,y2,'--', x,y3,':')
legend({'K < 0, Type III' 'K = 0, Type I' 'K > 0, Type II'})

k = 0 の場合、分布の x の確率密度は 0 になり、 $x < -\sigma/k + \mu$ となります。

k = 0 の場合、 $x &gt; -\sigma/k + \mu$ で分布の確率密度が 0 になります。

k = 0 の場合、上限と下限はありません。

この情報は役に立ちましたか?