prctile

データセットの百分位数

ページ内をすべて折りたたむ

構文

P = prctile(A,p)

P = prctile(A,p,"all")

P = prctile(A,p,dim)

P = prctile(A,p,vecdim)

P = prctile(___,Method=method)

説明

P = prctile(A,p) は、区間 [0,100] のパーセンテージ p について入力データ A での要素の百分位数を返します。

A がベクトルの場合、P はスカラーまたは p と同じ長さのベクトルです。P(i) には百分位数 p(i) が含まれます。
A が行列の場合、P は行ベクトルまたは行列であり、P の行数は length(p) と等しくなります。P の i 行目には、A の各列の百分位数 p(i) が含まれます。
A が多次元配列の場合、P には、サイズが 1 でない最初の配列次元に沿って計算された百分位数が含まれます。

例

P = prctile(A,p,"all") は x ですべての要素の百分位数を返します。

例

P = prctile(A,p,dim) は、次元 dim に沿って処理します。たとえば、A が行列の場合、prctile(A,p,2) は各行の要素について動作します。

例

P = prctile(A,p,vecdim) は、ベクトル vecdim で指定されている次元に沿って動作します。たとえば、A が行列の場合、prctile(A,p,[1 2]) は A のすべての要素について動作します。これは、次元 1 と次元 2 で定義された配列スライスに行列内のすべての要素が含まれるためです。

例

P = prctile(___,Method=method) は、指定されたメソッドを使用して百分位数を計算します。メソッドは、前述の構文で任意の入力引数の組み合わせに加えて指定します。

例

すべて折りたたむ

データベクトルの百分位数

ライブスクリプトを開く

特定のパーセンテージのデータセットの百分位数を計算します。

サイズが 7 のデータセットを生成します。

rng default % for reproducibility
A = randn(1,7)

A = 1×7

    0.5377    1.8339   -2.2588    0.8622    0.3188   -1.3077   -0.4336

A の要素の 42 番目の百分位数を計算します。

P = prctile(A,42)

P = 
-0.1026

すべての値の百分位数

ライブスクリプトを開く

配列内のすべての値の百分位数を求めます。

3×5×2 の配列を作成します。

rng default % for reproducibility
A = randn(3,5,2)

A = 
A(:,:,1) =

    0.5377    0.8622   -0.4336    2.7694    0.7254
    1.8339    0.3188    0.3426   -1.3499   -0.0631
   -2.2588   -1.3077    3.5784    3.0349    0.7147


A(:,:,2) =

   -0.2050    1.4090   -1.2075    0.4889   -0.3034
   -0.1241    1.4172    0.7172    1.0347    0.2939
    1.4897    0.6715    1.6302    0.7269   -0.7873

A のすべての要素の 40 番目と 60 番目の百分位数を求めます。

P = prctile(A,[40 60],"all")

P(1) は A の 40 番目の百分位数であり、P(2) は A の 60 番目の百分位数です。

データ行列の百分位数

ライブスクリプトを開く

指定したパーセンテージのデータ行列の列と行に沿って百分位数を計算します。

5 行 5 列のデータ行列を生成します。

A = (1:5)'*(2:6)

A = 5×5

     2     3     4     5     6
     4     6     8    10    12
     6     9    12    15    18
     8    12    16    20    24
    10    15    20    25    30

A の列ごとに 25 番目、50 番目、75 番目の百分位数を計算します。

P = prctile(A,[25 50 75],1)

P = 3×5

    3.5000    5.2500    7.0000    8.7500   10.5000
    6.0000    9.0000   12.0000   15.0000   18.0000
    8.5000   12.7500   17.0000   21.2500   25.5000

行列 P の各列には、行列 A の対応する列の 3 つの百分位数が含まれます。7、12、および 17 は A の 3 列目の 25 番目、50 番目、75 番目の百分位数であり、要素は 4、8、12、16、20 です。P = prctile(A,[25 50 75]) も同じ結果を返します。

A 行に沿って 25 番目、50 番目、75 番目の百分位数を計算します。

P = prctile(A,[25 50 75],2)

P = 5×3

    2.7500    4.0000    5.2500
    5.5000    8.0000   10.5000
    8.2500   12.0000   15.7500
   11.0000   16.0000   21.0000
   13.7500   20.0000   26.2500

行列 P の各行には、行列 A の対応する行の 3 つの百分位数が含まれます。2.75、4、および 5.25 は A の最初の行の 25 番目、50 番目、75 番目の百分位数であり、要素は 2、3、4、5、6 です。

多次元配列の百分位数

ライブスクリプトを開く

複数の次元に沿って多次元配列の百分位数を求めます。

3×5×2 の配列を作成します。

A = reshape(1:30,[3 5 2])

A = 
A(:,:,1) =

     1     4     7    10    13
     2     5     8    11    14
     3     6     9    12    15


A(:,:,2) =

    16    19    22    25    28
    17    20    23    26    29
    18    21    24    27    30

操作次元として次元 1 および 2 を指定して、A の各ページの 40 番目と 60 番目の百分位数を計算します。

Ppage = prctile(A,[40 60],[1 2])

Ppage = 
Ppage(:,:,1) =

    6.5000
    9.5000


Ppage(:,:,2) =

   21.5000
   24.5000

Ppage(1,1,1) は A の最初のページの 40 番目の百分位数であり、Ppage(2,1,1) は A の最初のページの 60 番目の百分位数です。

操作次元として次元 1 および 3 を指定して、各 A(:,i,:) スライス内の要素の 40 番目と 60 番目の百分位数を計算します。

Pcol = prctile(A,[40 60],[1 3])

Pcol = 2×5

    2.9000    5.9000    8.9000   11.9000   14.9000
   16.1000   19.1000   22.1000   25.1000   28.1000

Pcol(1,4) は A(:,4,:) 内の要素の 40 番目の百分位数であり、Pcol(2,4) は A(:,4,:) 内の要素の 60 番目の百分位数です。

特定のパーセンテージの tall ベクトルの百分位数

ライブスクリプトを開く

特定のパーセンテージの tall 列ベクトルの正確な百分位数および近似百分位数を計算します。

tall 配列に対して計算を実行すると、MATLAB® は並列プール (Parallel Computing Toolbox™ がある場合の既定) またはローカル MATLAB セッションのいずれかを使用します。Parallel Computing Toolbox がある場合にローカル MATLAB セッションを使用してサンプルを実行するには、関数mapreducerを使用してグローバル実行環境を変更します。

mapreducer(0)

airlinesmall データセットのデータストアを作成します。"NA" 値を欠損データとして扱って、datastore で NaN 値に置き換えられるようにします。ArrTime 変数を処理するように指定します。

ds = datastore("airlinesmall.csv","TreatAsMissing","NA", ...
    "SelectedVariableNames","ArrTime");

データストア上に tall table tt を作成し、tall table から tall ベクトル A にデータを抽出します。

tt = tall(ds)

tt =

  M×1 tall table

    ArrTime
    _______

      735  
     1124  
     2218  
     1431  
      746  
     1547  
     1052  
     1134  
       :
       :

A = tt{:,:}

A =

  M×1 tall double column vector

         735
        1124
        2218
        1431
         746
        1547
        1052
        1134
         :
         :

A の 50 番目の正確な百分位数を計算します。A が tall 列ベクトルで p がスカラーであるため、既定では prctile は正確な百分位数値を返します。

p = 50;
Pexact = prctile(A,p)

Pexact =

  tall double

    ?

Preview deferred. Learn more.

A の 50 番目の近似百分位数を計算します。"approximate" メソッドを指定して、百分位数を計算するためにT-Digestに基づいた近似アルゴリズムを使用します。

Papprox = prctile(A,p,Method="approximate")

Papprox =

  M×N×... tall array

    ?    ?    ?    ...
    ?    ?    ?    ...
    ?    ?    ?    ...
    :    :    :
    :    :    :

Preview deferred. Learn more.

gather を使用して、tall 配列を評価して結果をメモリに入れます。

[Pexact,Papprox] = gather(Pexact,Papprox)

Evaluating tall expression using the Local MATLAB Session:
- Pass 1 of 4: Completed in 0.77 sec
- Pass 2 of 4: Completed in 0.29 sec
- Pass 3 of 4: Completed in 0.42 sec
- Pass 4 of 4: Completed in 0.31 sec
Evaluation completed in 2.3 sec

Pexact = 
1522

Papprox = 
1.5220e+03

正確な百分位数と近似百分位数の値は、表示されている 4 桁までは同じです。

異なる次元に沿った tall 行列の百分位数

ライブスクリプトを開く

異なる次元に沿って指定したパーセンテージの tall 行列の正確な百分位数および近似百分位数を計算します。

mapreducer(0)

airlinesmall データセットから varnames に格納されている変数のサブセットが含まれた tall 行列 A を作成します。tall 配列からデータを抽出するステップの詳細については、特定のパーセンテージの tall ベクトルの百分位数を参照してください。

varnames = ["ArrDelay","ArrTime","DepTime","ActualElapsedTime"];
ds = datastore("airlinesmall.csv","TreatAsMissing","NA", ...
    "SelectedVariableNames",varnames);
tt = tall(ds);
A = tt{:,varnames}

A =

  M×4 tall double matrix

           8         735         642          53
           8        1124        1021          63
          21        2218        2055          83
          13        1431        1332          59
           4         746         629          77
          59        1547        1446          61
           3        1052         928          84
          11        1134         859         155
          :          :            :           :
          :          :            :           :

1 次元以外の次元に沿って演算する場合は、関数 prctile は、T-Digest に基づいた近似アルゴリズムではなく、並べ替えに基づいたアルゴリズム (アルゴリズムを参照) を使用して効率的に計算できるように、正確な百分位数を計算します。

2 番目の次元に沿って A の 25 番目、50 番目、75 番目の正確な百分位数を計算します。

p = [25 50 75];
Pexact = prctile(A,p,2)

Pexact =

  M×N×... tall array

    ?    ?    ?    ...
    ?    ?    ?    ...
    ?    ?    ?    ...
    :    :    :
    :    :    :

Preview deferred. Learn more.

関数が最初の次元に沿って演算し、p がパーセンテージのベクトルである場合、t-digest に基づいた近似アルゴリズムを使用して百分位数を計算する必要があります。並べ替えに基づいたアルゴリズムを使用して tall 配列の最初の次元に沿って百分位数を求めるのは、計算負荷が高い処理です。

最初の次元に沿って A の 25 番目、50 番目、75 番目の近似百分位数を計算します。既定の次元は 1 であるため、dim に値を指定する必要はありません。

Papprox = prctile(A,p,Method="approximate")

Papprox =

  M×N×... tall array

    ?    ?    ?    ...
    ?    ?    ?    ...
    ?    ?    ?    ...
    :    :    :
    :    :    :

Preview deferred. Learn more.

gather を使用して、tall 配列を評価して結果をメモリに入れます。

[Pexact,Papprox] = gather(Pexact,Papprox);

Evaluating tall expression using the Local MATLAB Session:
- Pass 1 of 1: Completed in 1.4 sec
Evaluation completed in 1.9 sec

A の 2 番目の次元に沿って 25 番目、50 番目、75 番目の正確な百分位数の最初の 5 行を表示します。

Pexact(1:5,:)

ans = 5×3
10³ ×

    0.0305    0.3475    0.6885
    0.0355    0.5420    1.0725
    0.0520    1.0690    2.1365
    0.0360    0.6955    1.3815
    0.0405    0.3530    0.6875

行列 Pexact の各行には、A の対応する行の 3 つの百分位数が含まれます。30.5、347.5、および 688.5 はそれぞれ A 内の最初の行の 25 番目、50 番目、75 番目の百分位数です。

最初の次元に沿って A の 25 番目、50 番目、75 番目の近似百分位数を表示します。

Papprox

Papprox = 3×4
10³ ×

   -0.0070    1.1149    0.9321    0.0700
         0    1.5220    1.3350    0.1020
    0.0110    1.9180    1.7400    0.1510

行列 Papprox の各列には、A 内の対応する列の 3 つの百分位数が含まれます。Papprox の最初の列には、A の最初の列の百分位数が含まれます。

入力引数

すべて折りたたむ

`A` — 入力配列
ベクトル | 行列 | 多次元配列

入力配列。ベクトル、行列または多次元配列として指定します。

データ型: double | single | duration

`p` — 百分位数を計算するパーセンテージ
スカラー | ベクトル

百分位数を計算するパーセンテージ。0 から 100 のスカラーまたはスカラーのベクトルとして指定します。

例: 25

例: [25, 50, 75]

データ型: double | single

`dim` — 演算の対象の次元
正の整数スカラー

演算の対象の次元。正の整数のスカラーとして指定します。次元を指定しない場合、既定値はサイズが 1 でない最初の配列次元です。

入力行列 A およびパーセンテージ p のベクトルを考えます。

P = prctile(A,p,1) は p 内のパーセンテージの A 内の列の百分位数を計算します。
P = prctile(A,p,2) は p 内のパーセンテージの A 内の行の百分位数を計算します。

次元 dim は、長さが p と同じである P の次元を示します。

`vecdim` — 演算の対象の次元のベクトル
正の整数のベクトル

演算の対象の次元のベクトル。正の整数のベクトルとして指定します。各要素は入力データの次元を表します。

指定された最小の操作次元の出力 P のサイズは、p の長さに等しくなります。vecdim で指定されたその他の操作次元の P のサイズは 1 です。vecdim で指定されていないすべての次元の P のサイズは入力データと同じままです。

2×3×3 の入力配列 A およびパーセンテージ p を考えます。prctile(A,p,[1 2]) では、1 と 2 が操作次元であり、min([1 2]) = 1 であるため、length(p)×1×3 の配列が返されます。返された配列の各ページには、A の対応するページの要素の百分位数が含まれます。

`method` — 百分位数を計算するメソッド
`"midpoint"` (既定値) | `"inclusive"` | `"exclusive"` | `"approximate"`

百分位数を計算するメソッド。次の値のいずれかとして指定します。

"midpoint" — 並べ替えを使用する中点アルゴリズムを使って百分位数を計算します。
R2025a より前: このメソッドには "exact" を使用します。
"inclusive" — 並べ替えを使用し、データの範囲内に 0 番目と 100 番目の百分位数を含めるアルゴリズムで百分位数を計算します。 (R2025a 以降)
"exclusive" — 並べ替えを使用し、データの範囲から 0 番目と 100 番目の百分位数を除外するアルゴリズムで百分位数を計算します。 (R2025a 以降)
"approximate" — double または single の入力配列に T-Digest を使用するアルゴリズムを使って近似百分位数を計算します。

百分位数の計算に関する詳細については、アルゴリズムを参照してください。

詳細

すべて折りたたむ

線形内挿

線形内挿は線形多項式を使用して、ベクトルまたは配列 x の点における基となる関数 Y = f(X) の値である y_i = f(x_i) を求めます。y₁ = f(x₁) および y₂ = f(x₂) であるデータ点 (x₁, y₁) および (x₂, y₂) について、線形内挿では、次のように x₁ から x₂ の与えられた x に対して y = f(x) を求めます。

$y = f (x) = y_{1} + \frac{(x - x_{1})}{(x_{2} - x_{1})} (y_{2} - y_{1}) .$

同様に、100(1.5/n) 番目の百分位数が y_1.5/n であり、100(2.5/n) 番目の百分位数が y_2.5/n の場合、線形内挿は次のように 100(2.3/n) 番目の百分位数 y_{2.3/n を求めます。}

$y_{\frac{2.3}{n}} = y_{\frac{1.5}{n}} + \frac{(\frac{2.3}{n} - \frac{1.5}{n})}{(\frac{2.5}{n} - \frac{1.5}{n})} (y_{\frac{2.5}{n}} - y_{\frac{1.5}{n}}) .$

T-Digest

T-digest [2] は、データセットの経験的累積分布関数 (CDF) のスパース表現である確率データ構造です。T-digest は、特にデータ分布の裾近傍で制御可能な精度を実現する方法であり、オンラインデータまたは分散データからランクベースの統計量 (百分位数や分位数など) の近似値を計算する際に役立ちます。

異なる区画に分散されているデータについて、t-digest は、計算の一定のメモリ制限および一定の相対精度 (q 番目の分位数の場合は $q (1 - q)$ ) を保ちながら、データ区画ごとに別々に推定分位数 (および推定百分位数) を計算してから、推定値を結合します。そのため、t-digest は tall 配列の処理に有用です。

異なる区画に分散している配列の分位数を推定するために、まずデータの各区画で t-digest を作成します。t-digest は区画内のデータをクラスタリングし、重心値、およびクラスターに寄与しているサンプルの数を表す累積の重みによって各クラスターの要約を示します。t-digest は大規模なクラスター (間隔が広い重心) を使用して q = 0.5 に近い CDF の領域を表し、小規模なクラスター (間隔が狭い重心) を使用して q = 0 および q = 1 に近い CDF の領域を表します。

t-digest は、圧縮パラメーター δ を使って分位数 q をインデックス k にマッピングするスケーリング関数を使用してクラスターサイズを制御します。つまり、次のようになります。

$k (q, δ) = δ \cdot (\frac{\sin^{- 1} (2 q - 1)}{π} + \frac{1}{2}),$

ここで、マッピング k は単調増加であり、最小値は k(0,δ) = 0 で最大値は k(1,δ) = δ です。下図は、δ = 10 の場合のスケーリング関数を示しています。

Scaling function plotted with q on the x-axis and k on the y-axis

このスケーリング関数は分位数 q をスケーリング係数 k に変換して、q の可変サイズのステップを求めています。そのため、クラスターサイズは不均等です (中央の分位数付近では大きく、q = 0 および q = 1 付近では小さくなっています)。クラスターが小さいほど、データの両端付近でより高い精度が得られます。

重みと位置をもつ新しい観測で t-digest を更新するために、新しい観測に最も近いクラスターを求めます。次に、重みを追加し、加重平均に基づいてクラスターの重心を更新します。ただし、クラスターの更新された重みがサイズ制限を超えないようにします。

t-digest の和集合を求めて重心をマージすることで、データの各区画の独立した t-digest を結合できます。t-digest を結合するために、まずすべての独立した t-digest のクラスターをクラスターの重みの降順で並べ替えます。次に、サイズ制限を満たしていれば、隣接するクラスターをマージして新しい t-digest を求めます。

データセット全体を表す t-digest が求まると、t-digest 内の各クラスターの端点 (境界) を推定し、各クラスターの端点間の内挿を使用して正確な推定分位数を求めます。

アルゴリズム

n 要素のベクトル A について、prctile 関数は、"approximate" 以外のメソッドが選択されている場合、並べ替えに基づくアルゴリズムを使用して百分位数を計算します。

A 内の並べ替えられた要素は、次の表に記載されているように、選択したメソッドに基づいて百分位数にマッピングされます。

百分位数	`Method`
百分位数	`"midpoint"` R2025a より前: `"exact"`	`"inclusive"` (R2025a 以降)	`"exclusive"` (R2025a 以降)
1 番目の並べ替えられた要素の百分位数	50/n	0	100/(n+1)
2 番目の並べ替えられた要素の百分位数	150/n	100/(n−1)	200/(n+1)
3 番目の並べ替えられた要素の百分位数	250/n	200/(n−1)	300/(n+1)
...	...	...	...
k 番目の並べ替えられた要素の百分位数	50(2k−1)/n	100(k−1)/(n−1)	100k/(n+1)
...	...	...	...
(n−1) 番目の並べ替えられた要素の百分位数	50(2n−3)/n	100(n−2)/(n−1)	100(n−1)/(n+1)
n 番目の並べ替えられた要素の百分位数	50(2n−1)/n	100	100n/(n+1)

たとえば、A が [6 3 2 10 1] の場合、百分位数は次の表に示すとおりです。

百分位数	`Method`
百分位数	`"midpoint"` R2025a より前: `"exact"`	`"inclusive"` (R2025a 以降)	`"exclusive"` (R2025a 以降)
`1` の百分位数	10	0	50/3
`2` の百分位数	30	25	100/3
`3` の百分位数	50	50	50
`6` の百分位数	70	75	200/3
`10` の百分位数	90	100	250/3

prctile 関数は線形内挿を使用して、A の最初の並べ替えられた要素から最後の並べ替えられた要素までのパーセンテージの百分位数を計算します。詳細については、線形内挿を参照してください。
たとえば、A が [6 3 2 10 1] の場合、次のようになります。
- midpoint メソッドの場合、40 番目の百分位数は 2.5 です。
  R2025a より前: exact メソッドの場合、40 番目の百分位数は 2.5 です。
- inclusive メソッドの場合、40 番目の百分位数は 2.6 です。 (R2025a 以降)
- exclusive メソッドの場合、40 番目の百分位数は 2.4 です。 (R2025a 以降)
prctile 関数は A 内の要素の最小値または最大値を、その範囲外のパーセンテージに対応する百分位数に割り当てます。
たとえば、A が [6 3 2 10 1] の場合、midpoint メソッドと exclusive メソッドの両方で、5 番目の百分位数は 1 です。 (R2025a 以降)
R2025a より前: たとえば、A が [6 3 2 10 1] の場合、exact メソッドでは、5 番目の百分位数は 1 です。

prctile 関数は NaN 値を欠損値として扱って削除します。

参照

[1] Langford, E. “Quartiles in Elementary Statistics”, Journal of Statistics Education. Vol. 14, No. 3, 2006.

[2] Dunning, T., and O. Ertl. “Computing Extremely Accurate Quantiles Using T-Digests.” August 2017.

拡張機能

すべて展開する

tall 配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

prctile 関数は tall 配列をサポートしていますが、以下の使用上の注意および制限があります。

P = prctile(A,p) は、A が tall 数値列ベクトルである場合にのみ、(並べ替えに基づいたアルゴリズムを使用して) 正確な百分位数値を返します。
P = prctile(A,p,dim) は、次の "いずれか" の条件が存在している場合にのみ正確な百分位数を返します。
- A が tall 数値列ベクトルである。
- A が tall 数値配列であり、dim が 1 でない。たとえば、prctile(A,p,2) は、tall 配列 A の行に沿って正確な百分位数を返します。
A が tall 数値配列で、dim が 1 の場合、百分位数の計算に T-Digest に基づいた近似アルゴリズムを使用するために method を "approximate" として指定する必要があります。たとえば、prctile(A,p,1,"Method","approximate") は、tall 配列 A の列に沿って近似百分位数を返します。
P = prctile(A,p,vecdim) は、次の "いずれか" の条件が存在している場合にのみ正確な百分位数を返します。
- A が tall 数値列ベクトルである。
- A が tall 数値配列であり、vecdim に 1 が含まれていない。たとえば、A が 3×5×2 の配列の場合、prctile(A,p,[2,3]) は各 A(i,:,:) スライス内の要素の正確な百分位数を返します。
- A が tall 数値配列であり、vecdim に 1 およびサイズが 1 でない A のすべての次元が含まれている。たとえば、A が 10×1×4 の配列の場合、prctile(A,p,[1 3]) は A(:,1,:) 内の要素の正確な百分位数を返します。
A が tall 数値配列であり、vecdim に 1 は含まれているが、サイズが 1 でない A のすべての次元は含まれていない場合、method を "approximate" として指定して近似アルゴリズムを使用する必要があります。たとえば、A が 10×1×4 の配列の場合、prctile(A,p,[1 2],"Method","approximate") を使用して A の各ページの近似百分位数を求めることができます。

詳細については、tall 配列を参照してください。

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

使用上の注意および制限:

"all" および vecdim 入力はサポートされていません。
名前と値の引数 Method はサポートされていません。
dim 入力引数はコンパイル時の定数でなければなりません。
dim 入力引数を指定しなかった場合、動作対象の (操作) 次元は生成されたコードで異なるものになる可能性があります。結果として、ランタイムエラーが発生する場合があります。詳細については、既定の次元の選択に関する MATLAB との非互換性 (MATLAB Coder)を参照してください。
出力 P がベクトルの場合、次のすべての条件が満たされていれば、P の方向は MATLAB^® と異なったものになります。
- dim を指定していない。
- A がコンパイル時には可変サイズ配列であり、可変サイズベクトルではないが、A が実行時にはベクトルである。
- ベクトル A の方向がベクトル p の方向と一致していない。
この場合、出力 P は、p の方向と一致せず、A の方向と一致します。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

prctile 関数は GPU 配列入力をサポートしますが、次の使用上の注意および制限があります。

"all" および vecdim 入力はサポートされていません。
名前と値の引数 Method はサポートされていません。

詳細については、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

分散配列
Parallel Computing Toolbox™ を使用して、クラスターの結合メモリ上で大きなアレイを分割します。

使用上の注意および制限:

duration 入力はサポートされません。

詳細については、分散配列を使用した MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2006a より前に導入

すべて展開する

R2025a: inclusive メソッドと exclusive メソッドを使用した百分位数の計算

inclusive メソッドと exclusive メソッドを使用して百分位数を計算できます。メソッドの名前をそれぞれ "inclusive" または "exclusive" として指定します。"inclusive" メソッドでは 0 番目と 100 番目の百分位数がデータの範囲内に含まれ、"exclusive" メソッドではそれらが除外されます。

また、既定のメソッドの名前が "exact" から "midpoint" に変更されています。prctile 関数では、下位互換性のために Method="exact" が引き続きサポートされます。

次の例は、既定のメソッドと 2 つの新しいメソッドの違いを示したものです。

x = 1:5;
P = prctile(x,25,Method="midpoint")

P = 1.7500

x = 1:5;
P = prctile(x,25,Method="inclusive")

P = 2

x = 1:5;
P = prctile(x,25,Method="exclusive")

P = 1.5000

R2022b: 小規模な入力データでのパフォーマンスの向上

より高速な入力解析により、関数 prctile のパフォーマンスが向上しました。パフォーマンスの向上は、入力解析が計算時間の大半を占める場合に顕著です。この状況は、以下の場合に発生します。

入力データのサイズが小さい。
百分位数を計算するパーセンテージの数が小さい。
既定の操作次元に沿って計算する。

たとえば、次のコードは、3000 個の要素をもつ行列について 4 つの百分位数を計算します。直前のリリースと比較して、このコードは約 5 倍速くなっています。

function timingPrctile
A = rand(300,10);
for k = 1:3e3
  P = prctile(A,[20 40 60 80]);
end
end

おおよその実行時間は以下のとおりです。

R2022a: 1.0 秒

R2022b: 0.2 秒

このコードの時間測定では、Windows^® 10、Intel^® Xeon^® CPU E5-1650 v4 (3.60 GHz) 搭載のテストシステムで、関数 timeit を使用しました。

timeit(@timingPrctile)

R2022a: Statistics and Machine Learning Toolbox から MATLAB に移行

以前は、prctile では Statistics and Machine Learning Toolbox™ が必要でした。

参考

quantile | median | iqr

prctile

構文

説明

例

データ ベクトルの百分位数

すべての値の百分位数

データ行列の百分位数

多次元配列の百分位数

特定のパーセンテージの tall ベクトルの百分位数

異なる次元に沿った tall 行列の百分位数

入力引数

A — 入力配列 ベクトル | 行列 | 多次元配列

p — 百分位数を計算するパーセンテージ スカラー | ベクトル

dim — 演算の対象の次元 正の整数スカラー

vecdim — 演算の対象の次元のベクトル 正の整数のベクトル

method — 百分位数を計算するメソッド "midpoint" (既定値) | "inclusive" | "exclusive" | "approximate"

詳細

線形内挿

T-Digest

アルゴリズム

参照

拡張機能

tall 配列 メモリの許容量を超えるような多数の行を含む配列を計算します。

C/C++ コード生成 MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU 配列 Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

分散配列 Parallel Computing Toolbox™ を使用して、クラスターの結合メモリ上で大きなアレイを分割します。

バージョン履歴

R2025a: inclusive メソッドと exclusive メソッドを使用した百分位数の計算

R2022b: 小規模な入力データでのパフォーマンスの向上

R2022a: Statistics and Machine Learning Toolbox から MATLAB に移行

参考

データベクトルの百分位数

`A` — 入力配列
ベクトル | 行列 | 多次元配列

`p` — 百分位数を計算するパーセンテージ
スカラー | ベクトル

`dim` — 演算の対象の次元
正の整数スカラー

`vecdim` — 演算の対象の次元のベクトル
正の整数のベクトル

`method` — 百分位数を計算するメソッド
`"midpoint"` (既定値) | `"inclusive"` | `"exclusive"` | `"approximate"`

tall 配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

C/C++ コード生成
MATLAB® Coder™ を使用して C および C++ コードを生成します。

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

分散配列
Parallel Computing Toolbox™ を使用して、クラスターの結合メモリ上で大きなアレイを分割します。