ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

plot

線形回帰モデルの散布図または追加変数プロット

説明

plot(mdl) は、線形回帰モデル mdl のプロットを作成します。プロットタイプは予測子変数の数によって異なります。

  • mdl に複数の予測子変数が含まれている場合、plot は全体から定数 (切片) 項を除外したモデルに対する追加変数プロットを作成します。これは plotAdded(mdl) と同じです。

  • mdl に単一の予測子変数が含まれている場合、plot は近似曲線と信頼限界が含まれているデータの散布図を作成します。

  • mdl に予測子が含まれていない場合、plot は残差のヒストグラムを作成します。これは plotResiduals(mdl) と同じです。

h = plot(mdl) は、プロット内のラインまたはパッチに対するグラフィックス オブジェクトを返します。プロットの作成後に特定のラインまたはパッチのプロパティを修正するには、h を使用します。プロパティの一覧については、Line のプロパティ および Patch のプロパティ を参照してください。

すべて折りたたむ

自動車の燃費の線形回帰モデルを重量とモデル年の関数として作成します。次に、追加変数プロットを作成して、モデルの有意性を確認します。

carsmall データセットから燃費の線形回帰モデルを作成します。

load carsmall
Year = categorical(Model_Year);
tbl = table(MPG,Weight,Year);
mdl = fitlm(tbl,'MPG ~ Year + Weight^2');

モデルの追加変数プロットを作成します。

plot(mdl)

水平線が信頼限界の間に収まっていないので、このプロットはモデルが有意であることを示しています。

関数 plotAdded を使用して、同じプロットを作成します。

plotAdded(mdl)

単純な線形回帰モデルに対して、近似曲線と信頼限界が含まれているデータの散布図を作成します。単純な線形回帰モデルには、1 つの予測子変数のみを含めます。

carsmall データセットから燃費の単純な線形回帰モデルを作成します。

load carsmall
tbl = table(MPG,Weight);
mdl = fitlm(tbl,'MPG ~ Weight')
mdl = 
Linear regression model:
    MPG ~ 1 + Weight

Estimated Coefficients:
                    Estimate        SE         tStat       pValue  
                   __________    _________    _______    __________

    (Intercept)        49.238       1.6411     30.002    2.7015e-49
    Weight         -0.0086119    0.0005348    -16.103    1.6434e-28


Number of observations: 94, Error degrees of freedom: 92
Root Mean Squared Error: 4.13
R-squared: 0.738,  Adjusted R-Squared: 0.735
F-statistic vs. constant model: 259, p-value = 1.64e-28

変数 WeightpValue は非常に小さいので、この変数がモデル内で統計的に有意であることがわかります。関数 plot を使用して近似曲線と 95% 信頼限界が含まれているデータの散布図を作成することにより、この結果を可視化します。

plot(mdl)

水平線が信頼限界の間に収まらないので、このプロットはモデルが有意であることを示しています。これは pValue の結果と一致します。

関数 plotAdded を使用して、同じプロットを作成します。

plotAdded(mdl)

定数項と 1 つの項のみがモデルに含まれている場合、調整された値は元の値と同じです。したがって、この追加変数プロットは、関数 plot で作成した散布図と同じです。

入力引数

すべて折りたたむ

線形回帰モデル。fitlm または stepwiselm を使用して作成した LinearModel オブジェクトを指定します。

出力引数

すべて折りたたむ

プロット内のラインまたはパッチに対応するグラフィックス オブジェクト。グラフィックス配列として返されます。グラフィックス オブジェクトのプロパティのクエリと設定を行うには、ドット表記を使用します。詳細については、Line のプロパティ および Patch のプロパティ を参照してください。

mdl に 1 つ以上の予測子が含まれている場合、h(1)h(2)h(3)h(4) はそれぞれ、調整されたデータ点、近似直線、近似直線の下限、近似直線の上限に対応します。

mdl に予測子が含まれていない場合、h は残差のヒストグラムに対応します。

詳細

すべて折りたたむ

追加変数プロット

追加変数プロット (偏回帰のてこ比のプロットとも呼ばれます) は、他のすべての項の効果を排除すると、指定した項が応答に与える効果がどの程度増加するかを示します。

単一の予測子変数に対応する単一の項を選択して plotAdded で作成した追加変数プロットには、以下のプロットが含まれます。

  • 調整された予測子変数の値に対する調整された応答値の散布図

  • 調整された予測子変数の値の関数としての、調整された応答値の近似直線

  • 近似直線の 95% 信頼限界

調整された値は、選択した予測子を除くすべての予測子にあてはめた変数の残差を変数の平均値に加算した値です。たとえば、1 番目の予測子変数 x1 に対する追加変数プロットを考えます。次のようにして、x1 を除くすべての予測子に、応答変数 y および選択した予測子変数 x1 をあてはめます。

yi = gy(x2i, x3i, …, xpi) + ryi

x1i = gx(x2i, x3i, …, xpi) + rxi

ここで、gy と gx はそれぞれ、選択した予測子 (x1) を除くすべての予測子に対する y および x1 の近似値です。ry と rx は、対応する残差ベクトルです。添字 i は、観測値の番号に対応します。調整された値は、各観測値の残差と平均値の合計です。

y˜i=y¯+ryi,x˜1i=x¯1+rxi,

ここで、x¯1y¯ はそれぞれ x1 および y の平均を表します。

plotAdded は、(x˜1i, y˜i) の散布図、x˜1 の関数としての y˜ の近似直線 (つまり β1x˜1)、および近似直線の 95% 信頼限界をプロットします。係数 β1 は、すべての予測子が含まれているフル モデルにおける x1 の係数推定値と同じです。

ryi は、応答値の中で (x1 を除く) 予測子では説明できない部分を表します。rxi は、x1 の値の中で他の予測子では説明できない部分を表します。したがって、近似直線は、x1 を追加することによって導入される新しい情報が、応答値の説明できない部分をどのように説明できるかを表します。近似直線の勾配がゼロに近く、信頼限界に水平線を含めることができる場合、プロットは x1 による新しい情報によっても応答値の説明できない部分を説明できないことを示します。つまり、x1 はモデルのあてはめにおいて有意ではありません。

plotAdded は、単一の項ではなく複数の項を選択できる、追加変数プロットの拡張機能もサポートします。したがって、カテゴリカル予測子、特定の予測子に関係するすべての項、または (定数 (切片) 項を除く) モデル全体も指定できます。係数ベクトル β をもつ予測子の集合 X を考えます。ここで、i 番目の係数を追加変数プロットに対して指定した場合、βi はフル モデルにおける xi の係数推定値です。それ以外の場合、βi はゼロです。単位方向ベクトル u を u = β/s として定義します。ここで、s = norm(β) です。すると、Xβ = (Xu)s になります。係数 s をもつ単一の予測子として Xu を扱い、単一の項に対してプロットを作成する場合と同じ方法で Xu に対する追加変数プロットを作成します。この追加変数プロットにおける近似直線の係数は、s に対応します。

モデルに複数の項が含まれている場合、plot は (定数項を除く) モデル全体に対して追加変数プロットを作成します。

ヒント

  • データ カーソルを使用すると、選択したプロットの点の値がデータ ヒント (データ点の横にある小さいテキスト ボックス) に表示されます。データ ヒントには、選択した点の x 軸および y 軸の値と、観測値の名前または番号が含まれます。

代替機能

  • LinearModel オブジェクトには、複数のプロット関数が用意されています。

    • モデルを作成するときに、予測子変数の追加または削除による効果を理解するには、plotAdded を使用します。

    • モデルを検証するときに、問題があるデータを探し、各観測値の効果を理解するには、plotDiagnostics を使用します。また、モデルの残差を分析するには、plotResiduals を使用します。

    • モデルをあてはめた後で、特定の予測子の効果を理解するには、plotAdjustedResponseplotPartialDependence および plotEffects を使用します。2 つの予測子の間の交互作用効果を理解するには、plotInteraction を使用します。また、予測曲面を通るスライスをプロットするには、plotSlice を使用します。

  • モデルに複数の項が含まれている場合、関数 plot は (定数項を除く) モデル全体に対して追加変数プロットを作成します。追加変数プロットで特定の予測子を選択するには、plotAdded を使用します。

R2012a で導入