Main Content

plotDiagnostics

非線形回帰モデルの診断プロット

説明

plotDiagnostics は、影響力が大きい観測値および外れ値を識別するための、観測値の診断情報 (てこ比やクックの距離の統計量など) のプロットを作成します。

plotDiagnostics(mdl) は、非線形回帰モデル (mdl) の観測値のてこ比プロットを作成します。プロット内の点線は、推奨されるしきい値を表します。

plotDiagnostics(mdl,plottype) は、観測値の診断情報のタイプ plottype を指定します。

plotDiagnostics(mdl,plottype,Name,Value) は、1 つ以上の名前と値の引数を使用して、診断データ点のグラフィック プロパティを指定します。たとえば、データ点のマーカー記号やサイズを指定できます。

h = plotDiagnostics(___) は、前の構文におけるいずれかの入力引数の組み合わせを使用して、プロット内のラインまたは等高線のグラフィックス オブジェクトを返します。プロットの作成後に特定のラインまたは等高線のプロパティを修正するには、h を使用します。プロパティの一覧については、Line のプロパティ および Contour のプロパティ を参照してください。

すべて折りたたむ

近似非線形モデルのてこ比のプロットを作成し、てこ比が高い点を求めます。

反応データを読み込み、反応物の関数として反応速度のモデルを当てはめます。

load reaction
mdl = fitnlm(reactants,rate,@hougen,[1 .05 .02 .1 2]);

当てはめたモデルのてこ比プロットを作成します。

plotDiagnostics(mdl)

データ ヒントを使用して、てこ比が大きい観測値を調べます。データ点上にカーソルを移動させると、データ ヒントが表示されます。

または、コマンド ラインに以下を入力しててこ比の高い観測を求めます。

find(mdl.Diagnostics.Leverage > 0.8)
ans =

     6

入力引数

すべて折りたたむ

非線形回帰モデル オブジェクト。fitnlm を使用して作成される NonLinearModel オブジェクトとして指定します。

プロットのタイプ。次の表のいずれかの値を指定します。

プロット タイププロット内の点線の基準線 目的
'contour'クックの距離の等高線を重ね合わせた、残差対てこ比クックの距離の等高線残差、てこ比およびクックの距離の値が大きい観測値を特定。
'cookd'クックの距離3*mean(mdl.Diagnostics.CooksDistance) によって計算された、推奨されるしきい値クックの距離の値が大きい観測値を特定。
'leverage'てこ比 (ハット行列の対角)2*p/n によって計算された、推奨されるしきい値てこ比が大きい観測値を特定。

'contour' を除くすべてのプロット タイプで、x 軸は観測値の行番号 (ケース順) です。

mdlDiagnostics プロパティには、plotDiagnostics がプロットの作成に使用した診断値が格納されます。

観測値の診断情報の詳細については、クックの距離、およびてこ比を参照してください。

名前と値の引数

オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで Name は引数名、Value は対応する値です。名前と値の引数は他の引数の後ろにする必要がありますが、ペアの順序は関係ありません。

R2021a より前では、名前と値をそれぞれコンマを使って区切り、Name を引用符で囲みます。

例: 'Color','blue','Marker','o'

メモ

ここでは、グラフィック プロパティの一部だけを紹介しています。完全な一覧については、Line のプロパティ を参照してください。指定したプロパティによって、診断データ点の外観が決まります。

ラインの色。'Color' と RGB 3 成分、16 進数のカラー コード、または、以下の表に記載されているいずれかの色オプションに対応する色の名前または省略名から構成されるコンマ区切りのペアとして指定します。

'MarkerEdgeColor''auto' (既定) であり 'MarkerFaceColor''auto' である場合、名前と値のペアの引数 'Color' はマーカーの輪郭の色とマーカーの塗りつぶし色も決定します。

カスタム色の場合は、RGB 3 成分または 16 進数のカラー コードを指定します。

  • RGB 3 成分は、色の赤、緑、青成分の強度を指定する 3 要素の行ベクトルです。強度は範囲 [0,1] に含まれていなければなりません。たとえば [0.4 0.6 0.7] のようになります。

  • 16 進数のカラー コードは、ハッシュ記号 (#) で始まり、0 から F の範囲にある 16 進数が 3 つまたは 6 つ続く、string スカラーまたは文字ベクトルです。この値では、大文字と小文字は区別されません。したがって、カラー コード "#FF8800""#ff8800""#F80""#f80" は等価です。

あるいは、一部の一般的な色を名前で指定できます。次の表は、名前が付いた色のオプション、等価な RGB 3 成分、および 16 進数のカラー コードの一覧です。

色の名前省略名RGB 3 成分16 進数のカラー コード外観
"red""r"[1 0 0]"#FF0000"

Sample of the color red

"green""g"[0 1 0]"#00FF00"

Sample of the color green

"blue""b"[0 0 1]"#0000FF"

Sample of the color blue

"cyan" "c"[0 1 1]"#00FFFF"

Sample of the color cyan

"magenta""m"[1 0 1]"#FF00FF"

Sample of the color magenta

"yellow""y"[1 1 0]"#FFFF00"

Sample of the color yellow

"black""k"[0 0 0]"#000000"

Sample of the color black

"white""w"[1 1 1]"#FFFFFF"

Sample of the color white

"none"該当なし該当なし該当なし色なし

以下は、MATLAB® が多くのタイプのプロットで使用する既定の色に対する RGB 3 成分および 16 進数のカラー コードです。

RGB 3 成分16 進数のカラー コード外観
[0 0.4470 0.7410]"#0072BD"

Sample of RGB triplet [0 0.4470 0.7410], which appears as dark blue

[0.8500 0.3250 0.0980]"#D95319"

Sample of RGB triplet [0.8500 0.3250 0.0980], which appears as dark orange

[0.9290 0.6940 0.1250]"#EDB120"

Sample of RGB triplet [0.9290 0.6940 0.1250], which appears as dark yellow

[0.4940 0.1840 0.5560]"#7E2F8E"

Sample of RGB triplet [0.4940 0.1840 0.5560], which appears as dark purple

[0.4660 0.6740 0.1880]"#77AC30"

Sample of RGB triplet [0.4660 0.6740 0.1880], which appears as medium green

[0.3010 0.7450 0.9330]"#4DBEEE"

Sample of RGB triplet [0.3010 0.7450 0.9330], which appears as light blue

[0.6350 0.0780 0.1840]"#A2142F"

Sample of RGB triplet [0.6350 0.0780 0.1840], which appears as dark red

例: 'Color','blue'

ラインの幅。'LineWidth' と正の値 (ポイント単位) から構成されるコンマ区切りのペアとして指定します。ラインにマーカーがある場合、ライン幅はマーカー エッジにも影響を与えます。

例: 'LineWidth',0.75

マーカー記号。'Marker' と次の表のいずれかの値から構成されるコンマ区切りのペアとして指定します。

マーカー説明結果として得られるマーカー
"o"

Sample of circle marker

"+"プラス記号

Sample of plus sign marker

"*"アスタリスク

Sample of asterisk marker

"."

Sample of point marker

"x"十字

Sample of cross marker

"_"水平線

Sample of horizontal line marker

"|"垂直線

Sample of vertical line marker

"square"正方形

Sample of square marker

"diamond"菱形

Sample of diamond marker

"^"上向き三角形

Sample of upward-pointing triangle marker

"v"下向き三角形

Sample of downward-pointing triangle marker

">"右向き三角形

Sample of right-pointing triangle marker

"<"左向き三角形

Sample of left-pointing triangle marker

"pentagram"星形五角形

Sample of pentagram marker

"hexagram"星形六角形

Sample of hexagram marker

"none"マーカーなし該当なし

例: 'Marker','+'

マーカーの輪郭の色。'MarkerEdgeColor' と RGB 3 成分、16 進数のカラー コード、または、名前と値のペアの引数 Color に記載されているいずれかの色オプションに対応する色の名前または省略名から構成されるコンマ区切りのペアとして指定します。

既定値 'auto' では、'Color' を使用して指定されるものと同じ色が使用されます。

例: 'MarkerEdgeColor','blue'

マーカーの塗りつぶし色。'MarkerFaceColor' と RGB 3 成分、16 進数のカラー コード、または、名前と値のペアの引数 Color に記載されているいずれかの色オプションに対応する色の名前または省略名から構成されるコンマ区切りのペアとして指定します。

'auto' では、'Color' を使用して指定されるものと同じ色が使用されます。

例: 'MarkerFaceColor','blue'

マーカー サイズ。'MarkerSize' と正の値 (ポイント単位) から構成されるコンマ区切りのペアとして指定します。

例: 'MarkerSize',2

出力引数

すべて折りたたむ

プロット内のラインまたは等高線に対応するグラフィックス オブジェクト。グラフィックス配列として返されます。グラフィックス オブジェクトのプロパティのクエリと設定を行うには、ドット表記を使用します。詳細については、Line のプロパティ および Contour のプロパティ を参照してください。

名前と値の引数を使用して、1 番目のグラフィックス オブジェクト h(1) に対応する、診断データ点の外観を指定できます。

詳細

すべて折りたたむ

ハット行列

"ハット行列" H は、データ行列 X およびヤコビ行列 J の項で定義されます。

Ji,j=fβj|xi,β

ここで、f は非線形モデル関数、β はモデル係数のベクトルです。

ハット行列 H は、以下のようになります。

H = J(JTJ)–1JT.

対角要素 Hii は次を満たします

0hii1i=1nhii=p,

ここで n は観測の数 (X の行) であり、p は回帰モデルの係数の数です。

てこ比

てこ比は、入力空間で特定の観測の位置が原因で発生した、回帰予測におけるその観測値の影響を測定します。

観測値 i のてこ比はハット行列 H の i 番目の対角項 hii の値です。てこ比値の合計は p (回帰モデルの係数の個数) なので、てこ比が p/n (n は観測値の個数) を大幅に超える場合、観測値 i は外れ値であると考えることができます。

クックの距離

観測値 i のクックの距離 Di

Di=j=1n(y^jy^j(i))2pMSE,

ここで

  • y^j は、j 番目の近似応答値です。

  • y^j(i) は、i 番目の観測値を除いて当てはめた j 番目の応答値です。

  • MSE は、平均二乗誤差です。

  • p は回帰モデルの係数の数です。

クックの距離は代数的には次の式と等価です。

Di=ri2pMSE(hii(1hii)2),

ここで、ei は i 番目の残差です。

ヒント

  • データ カーソルを使用すると、選択したプロットの点の値がデータ ヒント (データ点の横にある小さいテキスト ボックス) に表示されます。データ ヒントには、選択した点の x 軸および y 軸の値と、観測値の名前または番号が含まれます。

参照

[1] Neter, J., M. H. Kutner, C. J. Nachtsheim, and W. Wasserman. Applied Linear Statistical Models, Fourth Edition. Irwin, Chicago, 1996.

バージョン履歴

R2012a で導入