ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

plotDiagnostics

クラス: LinearModel

線形回帰モデルの診断のプロット

構文

plotDiagnostics(mdl)
plotDiagnostics(mdl,plottype)
h = plotDiagnostics(...)
h = plotDiagnostics(mdl,plottype,Name,Value)

説明

plotDiagnostics(mdl) はスケーリングした Delete-1 近似値を使用して、mdl 線形モデルの診断をプロットします。

plotDiagnostics(mdl,plottype) は、タイプ plottype のプロットで診断をプロットします。

h = plotDiagnostics(...) は、プロットのラインのハンドルを返します。

h = plotDiagnostics(mdl,plottype,Name,Value) は、追加のオプションを使用してプロットします。このオプションは Name,Value のペアの引数で指定されたものです。

ヒント

  • 多くのプロットでは、任意のデータ点の x の値と y の値、および観測名または観測番号が、Figure ウィンドウのデータ カーソル ツールに表示されます。

入力引数

mdl

fitlm または stepwiselm によって構築される線形モデル。

plottype

プロットのタイプを指定する文字列:

'contour'クックの等高線に重ね合わせた残差とてこ比の比較
'cookd'クックの距離
'covratio'共分散の行列式の Delete-1 比
'dfbetas'スケーリングされた Delete-1 係数推定値
'dffits'スケーリングされた Delete-1 近似値
'leverage'てこ比
's2_i'Delete-1 分散推定値

Delete-2 平均は、現在の観測を使用せずに新しいモデルを計算します。Delete-1 の計算が、すべての観測を使用したモデルと大きく異なる場合、その観測には影響力があります。

既定値: 'leverage'

名前/値のペアの引数

オプションの Name,Value の引数ペアをコンマ区切りで指定します。ここで、Name は引数名で、Value は対応する値です。Name は単一引用符 (' ') で囲まなければなりません。Name1,Value1,...,NameN,ValueN のように、複数の名前と値のペアの引数を任意の順序で指定できます。

    メモ:   プロットのプロパティ名と値のペアが最初に返されたハンドル h(1) に適用されます。

'Color'

ラインまたはマーカーの色、文字列または ColorSpec の仕様。詳細は、linespec を参照してください。

'LineStyle'

ラインのタイプ、文字列または Chart Line のプロパティ の仕様。詳細は、linespec を参照してください。

'LineWidth'

ラインまたは塗りつぶし領域のエッジの幅、ポイント数、正のスカラー値。1 ポイントは 1/72 インチに相当します。

既定値: 0.5

'MarkerEdgeColor'

マーカーの色または塗りつぶされたマーカーのエッジの色、文字列または ColorSpec の仕様。詳細は、linespec を参照してください。

'MarkerFaceColor'

マーカーの塗りつぶしに使用するマーカーの面の色、文字列または ColorSpec の仕様。詳細は、linespec を参照してください。

'MarkerSize'

ポイント単位のマーカーのサイズ、厳密に正のスカラー値。1 ポイントは 1/72 インチに相当します。

出力引数

h

プロットのラインまたはパッチに対するハンドルのベクトル。

定義

ハット行列

"ハット行列" H は、データ行列 X の項で定義されます。

H = X(XTX)–1XT.

対角要素 Hii は次を満たします

0hii1i=1nhii=p,

ここで n は観測の数 (X の行) であり、p は回帰モデルの係数の数です。

てこ比

観測値 i の "てこ比" はハット行列 H の i 番目の対角項 hii の値です。てこ比値の合計は p (回帰モデルの係数の数) であるため、観測値 i は、てこ比が p/n (n は観測の数) を大幅に超過した場合に、外れ値であると認識されます。

クックの距離

クックの距離は、近似値の変化をスケーリングしたものです。CooksDistance の各要素は、観測の削除により生じた係数のベクトルの変化を正規化したものです。観測値 i のクックの距離 Di は次のように表されます。

Di=j=1n(y^jy^j(i))2pMSE,

ここで以下のようになります。

  • y^j は、j 番目に近似された応答値です。

  • y^j(i) は、j 番目に近似された応答値です。ここで、近似には観測 i は含まれません。

  • MSE は、平均二乗誤差です。

  • p は回帰モデルの係数の数です。

クックの距離は代数的には次の式と等価です。

Di=ri2pMSE(hii(1hii)2),

ここで ri は i 番目の残差、hii は i 番目のてこ比値です。

CooksDistance は、LinearModel オブジェクトの Diagnostics テーブル内の n 行 1 列のベクトルです。

すべて折りたたむ

線形モデルのてこ比のプロット

近似モデルの観測のてこ比値をプロットします。

carsmall データを読み込み、モデル年、重量、および重量の二乗の関数として、燃費の線形モデルで近似します。

load carsmall
ds = dataset(MPG,Weight);
ds.Year = ordinal(Model_Year);
mdl = fitlm(ds,'MPG ~ Year + Weight^2');

てこ比値をプロットします。

plotDiagnostics(mdl)

クックの距離をプロットします。

plotDiagnostics(mdl,'cookd')

2 つの診断プロットの結果は異なります。

関連する例

参考文献

[1] Neter, J., M. H. Kutner, C. J. Nachtsheim, and W. Wasserman. Applied Linear Statistical Models, Fourth Edition. Irwin, Chicago, 1996.

代替法

mdl.Diagnostics プロパティには、plotDiagnostics がプロットの作成に使用する情報が含まれます。

参考

操作のヒント

この情報は役に立ちましたか?