ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

分位数と百分位数

この節では、Statistics and Machine Learning Toolbox™ 関数 quantile および prctile による分位数と百分位数の計算方法を説明します。

関数 prctile は、quantile による分位数の計算と似た方法で百分位数を計算します。次に示す分位数の計算手順は百分位数の場合でも同じです。データ標本が同じ場合、値 Q での分位数は値 P = 100*Q での百分位数と同じになります。

  1. quantile を使用すると、最初に X で並べ替えられた値が (0.5/n)、(1.5/n)、・・・([n – 0.5]/n) の各分位数に代入されます。次に例を示します。

    • 6 個の要素を含むデータ ベクトル、たとえば {6, 3, 2, 10, 8, 1} の場合、並べ替えた後の要素 {1, 2, 3, 6, 8, 10} は、それぞれ (0.5/6)、(1.5/6)、(2.5/6)、(3.5/6)、(4.5/6)、(5.5/6) の分位数に対応します。

    • 5 個の要素を含むデータ ベクトル、たとえば {2, 10, 5, 9, 13} の場合、並べ替えた後の要素 {2, 5, 9, 10, 13} は、それぞれ 0.1、0.3、0.5、0.7、0.9 の分位数に対応します。

    次の図は、この手法をデータ ベクトル X = {2, 10, 5, 9, 13} に対して適用した場合のものです。最初の観測は累積確率 1/5 = 0.2 に対応し、2 番目の観測は累積確率 2/5 = 0.4 に対応します。その他も同様です。この図のステップ関数はこれらの累積確率を表しています。一方、quantile は観測値を中点に配置するため、最初の観測を 0.5/5 = 0.1、2 番目の観測値を 1.5/5 = 0.3 などのように一致させ、最終的にこれらの中点が線で結合されます。次の図の赤い線は各中点を結んでいます。

    分位数への観測値の代入

    次の図のように軸を切り替えると、p 分位数に対応する変数 X の値を確認できます。

    X の分位数

  2. quantile は、線形内挿を使用してデータ値の間の分位数を求めます。

    "線形内挿" では線形多項式を使用して関数 f(x) を近似し、既知のデータ点の範囲内に新しいデータ ポイントを作成します。代数的には、y1 = f(x1) および y2 = f(x2) の場合にデータ点 (x1, y1) と (x2, y2) が与えられると、線形内挿では x1 と x2 の間にある x について y = f(x) が次のように計算されます。

    y=f(x)=y1+(xx1)(x2x1)(y2y1).

    同様に、1.5/n 分位数が y1.5/n、2.5/n 分位数が y2.5/n の場合、線形内挿では 2.3/n 分位数の y2.3/n は次のように計算されます。

    y2.3n=y1.5n+(2.3n1.5n)(2.5n1.5n)(y2.5ny1.5n).

  3. quantile は、X の最初の値である 0.5/n をより小さい確率の分位数に、最後の値である [n–0.5]/n をより大きい確率の分位数に代入します。

参照

[1] Langford, E. “Quartiles in Elementary Statistics”, Journal of Statistics Education. Vol. 14, No. 3, 2006.

参考

| |

関連するトピック