qqplot
分位数-分位数プロット
説明
qqplot(
は、正規分布による理論的な分位数値に対する標本データ x
)x
の分位数の分位数-分位数プロットを表示します。x
の分布が正規分布である場合、データ プロットは直線になります。
qqplot
は、プラス記号 ('+'
) マーカーを使用して x
内の各データ点をプロットし、理論的な分布を表す 2 本の基準線を描画します。実線の基準線はデータの 1 番目と 3 番目の四分位数を接続し、破線の基準線はデータの端まで実線を伸ばします。
例
正規分布の分位数-分位数プロット
分位数-分位数プロットを使用して、マサチューセッツ州のガソリン価格が正規分布に従うかどうかを判断します。
標本データを読み込みます。
load gas
price1
および price2
の標本データは、マサチューセッツ州の 20 か所のガソリン スタンドにおけるガソリン価格を表します。これらの標本は、2 つの異なる月に収集されました。
分位数-分位数プロットを作成して、price1
のガソリン価格が正規分布に従うかどうかを判断します。
figure qqplot(price1)
プロットではほぼ直線になっているので、ガソリン価格が正規分布に従うことがわかります。
2 つの標本による分位数-分位数プロット
分位数-分位数プロットを使用して、2 セットの標本データが同じ分布から派生しているかどうかを判断します。
標本データを読み込みます。
load gas
price1
および price2
の標本データは、マサチューセッツ州の 20 か所のガソリン スタンドにおけるガソリン価格を表します。これらの標本は、2 つの異なる月に収集されました。
両方の標本データのセットを使用して分位数-分位数プロットを作成し、異なる時期の価格が同じ分布に従うかどうかを評価します。
qqplot(price1,price2);
プロットではほぼ直線になっているので、2 セットの標本データは同じ分布であることがわかります。
ワイブル分布の分位数-分位数プロット
分位数-分位数プロットを使用して、標本データがワイブル分布から派生しているかどうかを判断します。
標本データを読み込みます。
load lightbulb
データの 1 列目には 2 種類の電球の寿命 (時間単位) が含まれています。2 列目には、電球のタイプに関する情報が含まれています。1 は蛍光灯電球を、0 は白熱灯電球を示します。3 列目には打ち切り情報が含まれます。1 は打ち切られたデータを示し、0 は正確な故障時間を示します。このデータは、シミュレーションされたものです。
打ち切られたデータを削除します。
lightbulb = [lightbulb(lightbulb(:,3)==0,1),...
lightbulb(lightbulb(:,3)==0,2)];
電球の各タイプについて変数を作成します。打ち切られていないデータのみを含めます。
fluo = [lightbulb(lightbulb(:,2)==0,1)]; insc = [lightbulb(lightbulb(:,2)==1,1)];
既定のパラメーター A = 1
および B = 1
を使用して、ワイブル確率分布オブジェクトを作成します。
pd = makedist('Weibull');
分位数-分位数プロットを作成して、蛍光灯電球の寿命がワイブル分布に従うかどうかを判断します。
figure qqplot(fluo,pd)
プロットでは直線になっていないので、蛍光灯電球の寿命データはワイブル分布に従わないことがわかります。
分位数-分位数プロットの座標軸の特定
関数 tiledlayout
と関数 nexttile
を使用して分位数-分位数プロットのペアを並べて表示します。
patients
データセットを読み込みます。患者の拡張期血圧レベルを 2 つのデータ セットに分け、一方に喫煙者の拡張期血圧レベル、もう一方に非喫煙者の拡張期血圧レベルを格納します。
load patients
smokerIndices = (Smoker == 1);
nonsmokerIndices = (Smoker == 0);
smokerDiastolic = Diastolic(smokerIndices);
nonsmokerDiastolic = Diastolic(nonsmokerIndices);
関数 tiledlayout
を使用して 2 行 1 列のタイル表示チャート レイアウトを作成します。関数 nexttile
を呼び出して、チャート レイアウト内に最初の座標軸のセット ax1
を作成します。この座標軸で、喫煙者の拡張期血圧レベルが正規分布から派生しているかどうかを判定する q-q プロットを表示します。関数 nexttile
を呼び出して、タイル表示チャート レイアウト内に 2 つ目の座標軸のセット ax2
を作成します。この座標軸で、非喫煙者の拡張期血圧レベルが正規分布から派生しているかどうかを判定する q-q プロットを表示します。
tiledlayout(2,1) % Top axes ax1 = nexttile; qqplot(ax1,smokerDiastolic) ylabel(ax1,'Diastolic Quantiles for Smokers') title(ax1,'QQ Plot of Smoker Diastolic Levels vs. Standard Normal') % Bottom axes ax2 = nexttile; qqplot(ax2,nonsmokerDiastolic) ylabel(ax2,'Diastolic Quantiles for Nonsmokers') title(ax2,'QQ Plot of Nonsmoker Diastolic Levels vs. Standard Normal')
2 つ目のプロットは直線に近く、非喫煙者の血圧値の標本はほぼ正規分布になっていることがわかります。一方、1 つ目のプロットは左側の点がラインの下にあり、正規分布よりも裾が厚くなっている (外れ値が多い) ことがわかります。
入力引数
x
— 標本データ
数値ベクトル | 数値行列
標本データ。数値ベクトルまたは数値行列を指定します。x
が行列の場合、qqplot
は各列に対して別々のラインを表示します。
qqplot
は、プロット記号 '+'
を使用して標本データを表示します。各分布の 1 番目および 3 番目の四分位数を結ぶラインがプロットに重ね合わせられます。このラインは、x
内のデータに対する順序統計量のロバスト線形近似を表します。データの直線性を評価しやすくするため、このラインは x
の最小値および最大値まで外挿されます。
データ型: single
| double
y
— 2 番目の標本データのセット
数値ベクトル | 数値行列
2 番目の標本データのセット。数値ベクトルまたは数値行列を指定します。x
と y
が同じ長さである必要はありません。ただし、x
と y
が行列の場合は列数が同じでなければなりません。x
と y
が行列の場合、qqplot
は列の各ペアに対して別々のラインを表示します。
qqplot
は、小さい方のデータセットのサイズに基づいて、プロットする分位数を選択します。
データ型: single
| double
ax
— プロットの座標軸
Axes
オブジェクト
プロットの座標軸。Axes
オブジェクトとして指定します。ax
を指定しない場合、qqplot
は、現在の座標軸を使用してプロットを作成します。Axes
オブジェクトを作成する方法の詳細については、axes
を参照してください。
出力引数
h
— line オブジェクトのグラフィックス ハンドル
Line
グラフィックス ハンドルのベクトル
line オブジェクトのグラフィックス ハンドル。Line
グラフィックス ハンドルのベクトルとして返されます。グラフィックス ハンドルは、プロットの特定の線のプロパティをクエリおよび変更するために使用できる一意な識別子です。qqplot
は x
の各列について 3 つのハンドルを返します。
データ点を表す線。
qqplot
は、プラス記号 ('+'
) マーカーを使用してx
内の各データ点を表します。x
の各列の 1 番目および 3 番目の四分位数を結合するライン。実線として表されます。x
の最小値および最大値まで伸びる四分位線の外挿。破線として表されます。
line オブジェクトのプロパティを表示および設定するには、ドット表記を使用します。ドット表記の使用法の詳細については、プロパティ値へのアクセスを参照してください。設定できる Line
オブジェクトのプロパティの詳細については、Line のプロパティ を参照してください。
詳細
分位数-分位数プロット
"分位数-分位数プロット" ("q-q プロット" とも呼ばれます) では、標本データが特定の分布から派生しているかどうかを視覚的に評価します。また q-q プロットは、2 セットの標本データが同じ分布から派生しているかどうかを評価します。
q-q プロットでは、標本データの値が昇順で並べ替えられてから、標本データの各分位数における指定された分布の期待値に対してこれらの値がプロットされます。入力された標本の分位数値は y 軸に沿って表示され、同じ分位数における指定された分布の理論的な値は x 軸に沿って表示されます。生成されるプロットが直線の場合、指定された分布から標本データが派生していると考えられます。
q-q プロットでは、標本データに含まれている値の個数に基づいて分位数が選択されます。標本データに n 個の値が含まれている場合、プロットでは n 個の分位数が使用されます。順序付けられた i 番目の値 (i 番目の "順序統計量" とも呼ばれます) は、指定された分布の 番目の分位数に対してプロットされます。
また、q-q プロットでは、基になる分布が不明な場合でも、2 セットの標本データが同じ分布に従っているかどうかを評価できます。1 番目のデータセットの分位数値は x 軸に表示され、2 番目のデータセットの対応する分位数値は y 軸に表示されます。q-q プロットでは分位数を使用するので、2 つの標本のデータ点の数が同じである必要はありません。標本サイズが異なる場合、小さい方のデータセットに基づいて分位数が選択されます。生成されるプロットが直線の場合、2 セットの標本データは同じ分布から派生していると考えられます。
バージョン履歴
R2006a より前に導入
MATLAB コマンド
次の MATLAB コマンドに対応するリンクがクリックされました。
コマンドを MATLAB コマンド ウィンドウに入力して実行してください。Web ブラウザーは MATLAB コマンドをサポートしていません。
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)