cvloss
クラス: RegressionTree
交差検証による回帰誤差
構文
E = cvloss(tree)
[E,SE] = cvloss(tree)
[E,SE,Nleaf] = cvloss(tree)
[E,SE,Nleaf,BestLevel] = cvloss(tree)
[E,...] = cvloss(tree,Name,Value)
説明
は、回帰木 E
= cvloss(tree
)tree
の交差検証による回帰誤差 (損失) を返します。
[
は、E
,SE
] = cvloss(tree
)E
の標準誤差を返します。
[
は、ツリー E
,SE
,Nleaf
] = cvloss(tree
)tree
の葉 (終了ノード) の数を返します。
[
は、E
,SE
,Nleaf
,BestLevel
] = cvloss(tree
)tree
の最適な枝刈りレベルを返します。
[
は、追加のオプションを使用して交差検証を行います。このオプションは E
,...] = cvloss(tree
,Name,Value
)Name,Value
のペアの引数で指定されたものです。Name1,Value1,…,NameN,ValueN
のように、複数の名前と値のペアの引数を任意の順番で指定できます。
入力引数
tree
— 学習済みの回帰木
RegressionTree
オブジェクト
学習済み回帰木。fitrtree
を使用して構築した RegressionTree
オブジェクトとして指定します。
名前と値の引数
オプションの引数のペアを Name1=Value1,...,NameN=ValueN
として指定します。ここで Name
は引数名、Value
は対応する値です。名前と値の引数は他の引数の後ろにする必要がありますが、ペアの順序は関係ありません。
R2021a より前では、名前と値をそれぞれコンマを使って区切り、Name
を引用符で囲みます。
Subtrees
— 枝刈りレベル
0 (既定値) | 非負の整数のベクトル | 'all'
枝刈りレベル。'Subtrees'
と昇順の非負の整数のベクトルまたは 'all'
から構成されるコンマ区切りのペアとして指定します。
ベクトルを指定する場合、すべての要素が 0
から max(tree.PruneList)
の範囲になければなりません。0
は枝刈りしない完全な木を、max(tree.PruneList)
は完全に枝刈りした木 (つまり、ルート ノードのみ) を表します。
'all'
を指定した場合、cvloss
はすべての部分木 (枝刈り順序全体) に作用します。これは、0:max(tree.PruneList)
を指定することと同じです。
cvloss
では、Subtrees
で指定された各レベルまで tree
の枝刈りを行ってから、対応する出力引数を推定します。Subtrees
のサイズにより、一部の出力引数のサイズが決まります。
Subtrees
を呼び出すために、tree
の PruneList
プロパティまたは PruneAlpha
プロパティを空にすることはできません。言い換えると、'Prune','on'
を設定して tree
を成長させるか、prune
を使用して tree
の枝刈りを行います。
例: 'Subtrees','all'
データ型: single
| double
| char
| string
TreeSize
— 木のサイズ
'se'
(既定値) | 'min'
木のサイズ。'TreeSize'
と次のいずれかから構成されるコンマ区切りのペアとして指定します。
'se'
—cvloss
は、コストが最小コストの 1 標準誤差以内になる最小のツリーを使用します。'min'
—cvloss
は最小コストのツリーを使用します。
KFold
— 分割の数
10 (既定値) | 1 より大きい正の整数値
交差検証木で使用する分割の数。'KFold'
と 1 より大きい正の整数値から構成されるコンマ区切りのペアとして指定します。
例: 'KFold',8
出力引数
E
— 平均二乗誤差
スカラー値 | 数値ベクトル
交差検証の平均二乗誤差 (損失)。名前と値のペア Subtrees
の設定に応じてベクトルまたはスカラーが返されます。
SE
— 標準誤差
スカラー値 | 数値ベクトル
E
の標準誤差。名前と値のペア Subtrees
の設定に応じてベクトルまたはスカラーが返されます。
Nleaf
— 葉ノードの数
整数値のベクトル
tree
の葉ノードの数。名前と値のペア Subtrees
の設定に応じてベクトルまたはスカラーが返されます。葉ノードは終了ノードであり、分割ではなく応答を与えます。
BestLevel
— 最適な枝刈りレベル
スカラー値
名前と値のペア TreeSize
で定義した最適な枝刈りレベル。スカラー値として返されます。値は、TreeSize
の設定に応じて次のようになります。
TreeSize
が'se'
の場合、誤差が最小のSE
の範囲内にあるE
の値を達成できる最大の枝刈りレベルがBestLevel
になります。TreeSize
が'min'
の場合、Subtrees
の最小値がBestLevel
になります。
例
交差検証誤差の計算
既定の回帰木について交差検証誤差を計算します。
carsmall
データセットを読み込みます。Displacement
、Horsepower
および Weight
が応答 MPG
の予測子であると考えます。
load carsmall
X = [Displacement Horsepower Weight];
データセット全体を使用して回帰木を成長させます。
Mdl = fitrtree(X,MPG);
交差検証誤差を計算します。
rng(1); % For reproducibility
E = cvloss(Mdl)
E = 27.6976
E
は、(分割内のテスト観測値の個数で重みを付けた) 10 分割の加重平均 MSE です。
交差検証による最適な枝刈りレベルの探索
k 分割の交差検証を適用して、すべての部分木について最適な回帰木の枝刈りレベルを探索します。
carsmall
データセットを読み込みます。Displacement
、Horsepower
および Weight
が応答 MPG
の予測子であると考えます。
load carsmall
X = [Displacement Horsepower Weight];
データセット全体を使用して回帰木を成長させます。生成された木を表示します。
Mdl = fitrtree(X,MPG); view(Mdl,'Mode','graph')
最下位から 2 つおよび最上位の枝刈りレベルを除き、部分木ごとに 5 分割の交差検証誤差を計算します。すべての部分木で最適な枝刈りレベルを返すように指定します。
rng(1); % For reproducibility
m = max(Mdl.PruneList) - 1
m = 15
[~,~,~,bestLevel] = cvloss(Mdl,'SubTrees',2:m,'KFold',5)
bestLevel = 14
15
個の枝刈りレベルの中で、最適な枝刈りレベルは 14
です。
最適なレベルまで木を枝刈りします。生成された木を表示します。
MdlPrune = prune(Mdl,'Level',bestLevel); view(MdlPrune,'Mode','graph')
代替方法
crossval
を使用して交差検証ツリーのモデルを構築し、cvloss
の代わりに kfoldLoss
を呼び出すことができます。交差検証を行った木を複数回調べる場合、この代替方法では時間が節約できる可能性があります。
ただし、cvloss
と異なり、kfoldLoss
は SE
、Nleaf
、または BestLevel
を返しません。
拡張機能
GPU 配列
Parallel Computing Toolbox™ を使用してグラフィックス処理装置 (GPU) 上で実行することにより、コードを高速化します。
この関数は、GPU 配列を完全にサポートします。詳細は、GPU での MATLAB 関数の実行 (Parallel Computing Toolbox)を参照してください。
MATLAB コマンド
次の MATLAB コマンドに対応するリンクがクリックされました。
コマンドを MATLAB コマンド ウィンドウに入力して実行してください。Web ブラウザーは MATLAB コマンドをサポートしていません。
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)