Main Content

cdfplot

経験的累積分布関数 (cdf) プロット

説明

cdfplot(x) は、x 内のデータについて経験的累積分布関数 (cdf) プロットを作成します。x 内の値 t に対する経験的 cdf F(t) は、t 以下である x 内の値の比率です。

cdfplot(ax,x) は、現在の座標軸 (gca) ではなく ax によって指定される座標軸にプロットします。 (R2024a 以降)

h = cdfplot(___) は、経験的 cdf プロットの line オブジェクトのハンドルを返します。作成後にオブジェクトのプロパティのクエリまたは変更を行うには、h を使用します。プロパティの一覧については、Line のプロパティを参照してください。

[h,stats] = cdfplot(___) は、x 内のデータについての要約統計量が含まれている構造体も返します。

すべて折りたたむ

標本データ セットの経験的 cdf をプロットし、標本データ セットの基となる分布の理論的な cdf と比較します。実際には、理論的な cdf は不明な場合があります。

位置パラメーターが 0、スケール パラメーターが 3 の極値分布から、ランダムな標本データ セットを生成します。

rng('default')  % For reproducibility
y = evrnd(0,3,100,1);

標本データ セットの経験的 cdf と理論的な cdf を同じ図にプロットします。

cdfplot(y)
hold on
x = linspace(min(y),max(y));
plot(x,evcdf(x,0,3))
legend('Empirical CDF','Theoretical CDF','Location','best')
hold off

このプロットは、経験的 cdf と理論的な cdf の間の類似性を示します。

代わりに、関数 ecdf を使用することもできます。関数 ecdf は、グリーンウッドの公式を使用して推定した 95% 信頼区間もプロットします。詳細については、アルゴリズムを参照してください。

ecdf(y,'Bounds','on')
hold on
plot(x,evcdf(x,0,3))
grid on
title('Empirical CDF')
legend('Empirical CDF','Lower Confidence Bound','Upper Confidence Bound','Theoretical CDF','Location','best')
hold off

kstest を使用して、1 標本コルモゴロフ・スミルノフ検定を実行します。経験的累積分布関数 (cdf) を標準正規 cdf と視覚的に比較することにより、検定の判定を確認します。

examgrades データ セットを読み込みます。試験採点データの 1 列目が含まれているベクトルを作成します。

load examgrades
test1 = grades(:,1);

平均が 75、標準偏差が 10 の正規分布にデータが由来しているという帰無仮説を検定します。kstest の既定の設定では標準正規分布について検定を行うので、これらのパラメーターを使用してデータ ベクトルの各要素をセンタリングおよびスケーリングします。

x = (test1-75)/10;
h = kstest(x)
h = logical
   0

h = 0 の戻り値は、kstest が既定の有意水準 5% で帰無仮説を棄却できないことを示します。

経験的累積分布関数と標準正規累積分布関数をプロットして、視覚的に比較します。

cdfplot(x)
hold on
x_values = linspace(min(x),max(x));
plot(x_values,normcdf(x_values,0,1),'r-')
legend('Empirical CDF','Standard Normal CDF','Location','best')

Figure には、センタリングおよびスケーリングされたデータ ベクトルの経験的累積分布関数と標準正規分布の累積分布関数の間の類似性が示されています。

入力引数

すべて折りたたむ

入力データ。数値ベクトルを指定します。

データ型: single | double

R2024a 以降

ターゲットの座標軸。axes オブジェクトとして指定します。座標軸を指定しない場合、cdfplot は現在の座標軸 (gca) を使用します。

出力引数

すべて折りたたむ

経験的 cdf プロットの line オブジェクトのハンドル。chart line オブジェクトとして返されます。作成後にオブジェクトのプロパティのクエリまたは変更を行うには、h を使用します。プロパティの一覧については、Line のプロパティを参照してください。

x 内のデータの要約統計量。以下のフィールドをもつ構造体として返されます。

フィールド説明

min

最小値

max

最大値

mean

標本平均値

median

標本中央値 (50 百分位数)

std

標本標準偏差

ヒント

  • cdfplot は、標本データ セットの分布を確認するために役立ちます。理論的な cdf を同じ cdfplot のプロットに重ね合わせて、標本の経験的分布を理論的分布と比較できます。たとえば、経験的 cdf と理論的な cdf の比較を参照してください。

  • 関数 kstestkstest2 および lillietest は、経験的 cdf から導かれる検定統計量を計算します。cdfplot は、これらの関数からの出力を理解するために役立ちます。たとえば、標準正規分布の検定を参照してください。

代替機能

関数 ecdf を使用すると、経験的 cdf の値を求めて経験的 cdf のプロットを作成することができます。関数 ecdf では、打ち切られたデータが示され、推定された cdf 値の信頼限界が計算されます。

バージョン履歴

R2006a より前に導入

すべて展開する