resubPredict

再代入による回帰木の応答の予測

構文

Yfit = resubPredict(tree)

Yfit = resubPredict(tree,Subtrees=subtrees)

[Yfit,node] = resubPredict(___)

説明

Yfit = resubPredict(tree) は、データ tree.X について tree で予測された応答を含む tree.X 要素のベクトルを返します。Yfit には、fitrtree で tree の作成に使用されたデータに関する tree の予測が格納されます。

例

Yfit = resubPredict(tree,Subtrees=subtrees) は、応答を予測する前に、さらに tree を subtrees で指定されたレベルまで枝刈りします。

[Yfit,node] = resubPredict(___) は、前の構文の入力引数の組み合わせのいずれかを使用して、再代入データでの tree のノード数も返します。

例

すべて折りたたむ

標本内 MSE の計算

ライブスクリプトを開く

carsmall データセットを読み込みます。Displacement、Horsepower および Weight が応答 MPG の予測子であると考えます。

load carsmall
X = [Displacement Horsepower Weight];

すべての観測値を使用して回帰木を成長させます。

Mdl = fitrtree(X,MPG);

再代入の MSE を計算します。

Yfit = resubPredict(Mdl);
mean((Yfit - Mdl.Y).^2)

ans = 
4.8952

resubLoss を使用すると同じ結果が得られます。

resubLoss(Mdl)

ans = 
4.8952

各部分木の標本内応答の推定

ライブスクリプトを開く

carsmall データセットを読み込みます。Weight が応答 MPG の予測子であると考えます。

load carsmall
idxNaN = isnan(MPG + Weight);
X = Weight(~idxNaN);
Y = MPG(~idxNaN);
n = numel(X);

すべての観測値を使用して回帰木を成長させます。

Mdl = fitrtree(X,Y);

いくつかの枝刈りレベルで部分木の再代入の当てはめた値を計算します。

m = max(Mdl.PruneList);
pruneLevels = 1:4:m; % Pruning levels to consider
z = numel(pruneLevels);
Yfit = resubPredict(Mdl,Subtrees=pruneLevels);

Yfit は、当てはめた値が含まれている n 行 z 列の行列です。各行は観測値に、各列は部分木に対応しています。

Yfit と Y のいくつかの列を X に対してプロットします。

sortDat = sortrows([X Y Yfit],1); % Sort all data with respect to X
plot(repmat(sortDat(:,1),1,size(Yfit,2)+1),sortDat(:,2:end)) % Vectorize for efficiency
lev = num2str((pruneLevels)',"Level %d MPG");
legend(["Observed MPG"; lev])
title("In-Sample Fitted Responses")
xlabel("Weight (lbs)")
ylabel("MPG")
h = findobj(gcf);
set(h(4:end),LineWidth=3) % Widen all lines

Figure contains an axes object. The axes object with title In-Sample Fitted Responses, xlabel Weight (lbs), ylabel MPG contains 5 objects of type line. These objects represent Observed MPG, Level 1 MPG, Level 5 MPG, Level 9 MPG, Level 13 MPG.

下位の枝刈りレベルでは、Yfit の値が上位レベルよりデータに近づく傾向があります。上位の枝刈りレベルでは、X の間隔が大きくなるのでフラットになる傾向があります。

入力引数

すべて折りたたむ

`tree` — 回帰木モデル
`RegressionTree` モデルオブジェクト

回帰木モデル。fitrtree で学習させた RegressionTree モデルオブジェクトとして指定します。

`subtrees` — 枝刈りレベル
`0` (既定値) | 非負の整数のベクトル | `"all"`

枝刈りレベル。昇順の非負の整数のベクトルまたは "all" として指定します。

ベクトルを指定する場合、すべての要素が 0 から max(tree.PruneList) の範囲になければなりません。0 は枝刈りしない完全な木を、max(tree.PruneList) は完全に枝刈りした木 (つまり、ルートノードのみ) を表します。

"all" を指定した場合、resubPredict はすべての部分木 (つまり、枝刈り順序全体) に作用します。これは、0:max(tree.PruneList) を指定することと同じです。

resubPredict では、subtrees で指定された各レベルまで tree の枝刈りを行ってから、対応する出力引数を推定します。subtrees のサイズにより、一部の出力引数のサイズが決まります。

関数で subtrees を呼び出すために、tree の PruneList プロパティと PruneAlpha プロパティは空以外でなければなりません。言い換えると、fitrtree を使用するときに Prune="on" を設定して tree を成長させるか、prune を使用して tree を枝刈りすることで成長させます。

データ型: single | double | char | string

出力引数

すべて折りたたむ

`Yfit` — 予測した再代入応答の値
数値ベクトル | 数値行列

学習データについて予測した再代入応答の値。数値ベクトルまたは数値行列として返されます。Yfit は学習応答データ tree.Y と同じデータ型になります。

subtrees が数値スカラーの場合、Yfit は数値列ベクトルとして返されます。それ以外の場合、Yfit は m 列の数値行列として返されます。m は部分木の数です。各列は、対応する部分木の予測を表します。

`node` — ノード番号
数値列ベクトル | 数値行列

予測クラスのノード番号。数値列ベクトルまたは数値行列として返されます。

subtrees がスカラーであるか指定されていない場合、resubPredict は node を n 行 (tree.X と同じ行数) の数値列ベクトルとして返します。

subtrees に m > 1 のエントリが含まれる場合、node は n 行 m 列の数値行列になります。各列は、対応するサブツリーのノード予測を表します。

拡張機能

すべて展開する

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

この関数は、GPU 配列を完全にサポートします。詳細は、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。

バージョン履歴

R2011a で導入

参考

resubLoss | predict | fitrtree | RegressionTree

resubPredict

構文

説明

例

標本内 MSE の計算

各部分木の標本内応答の推定

入力引数

tree — 回帰木モデル RegressionTree モデル オブジェクト

subtrees — 枝刈りレベル 0 (既定値) | 非負の整数のベクトル | "all"

出力引数

Yfit — 予測した再代入応答の値 数値ベクトル | 数値行列

node — ノード番号 数値列ベクトル | 数値行列

拡張機能

GPU 配列 Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。

バージョン履歴

参考

`tree` — 回帰木モデル
`RegressionTree` モデルオブジェクト

`subtrees` — 枝刈りレベル
`0` (既定値) | 非負の整数のベクトル | `"all"`

`Yfit` — 予測した再代入応答の値
数値ベクトル | 数値行列

`node` — ノード番号
数値列ベクトル | 数値行列

GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。