ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

TreeBagger クラス

決定木の集団のブートストラップ集団

説明

TreeBagger は、分類または回帰のいずれかについて決定木の集団をバギングします。"バギング" とは、ブートストラップ集団を意味します。集団内の各ツリーは、個々に抽出された入力データのブートストラップ複製上で成長します。この複製に含まれない観測値は、このツリーにとって "out of bag" となります。未観測データのツリーの集団の予測を計算するため、TreeBagger は個別のツリーの予測値の平均を取ります。バギングされた集団の予測誤差を推定するには、out-of-bag 観測値について各ツリーの予測値を計算し、各観測値について集団全体でのこれらの予測値を平均します。次に、予測した out-of-bag 応答とこの観測値での真の値とを比較します。

個別のツリーの生育に関して、TreeBaggerClassificationTreeRegressionTree の機能に依存します。特に、ClassificationTreeRegressionTree は各決定分割について無作為に選択された特徴の個数をオプションの入力引数として受け入れます。

compact メソッドは、別のクラス CompactTreeBagger のオブジェクトを、新しいデータを使用する予測子を作成するために十分な情報と共に返します。この情報には、(分類に対する) ツリーの集団、変数名、クラス名が含まれます。CompactTreeBagger が必要とするメモリは、TreeBagger より少量ですが、集団のためにより多くのツリーを生育させるメソッドをもっているのは TreeBagger だけです。TreeBagger を使用してツリーの集団を生育し、学習データにアクセスする必要がなくなったら、それ以降はコンパクトなバージョンの学習済み集団を操作する方を選択することができます。

構築

TreeBaggerバギングされた決定木の集団を作成する

メソッド

append集団に新しいツリーを追加する
compact決定木のコンパクトな集団
error誤差 (誤判別の確率または MSE)
fillProximities学習データの近接行列
growTrees追加のツリーの育成と集団への追加
margin分類マージン
mdsProx近接行列の多次元尺度構成法
meanMargin平均分類マージン
oobErrorout-of-bag 誤差
oobMarginout-of-bag マージン
oobMeanMarginout-of-bag 平均マージン
oobPredictout-of-bag 観測に対する集団予測
predict予測応答

プロパティ

ClassNames

応答変数 Y 用のクラス名を含むセル配列です。回帰木の場合、このプロパティは空です。

ComputeOOBPrediction

観測の学習用に out-of-bag 予測を計算するかどうかを指定する論理フラグです。既定の設定は false です。

このフラグが真の場合、次のプロパティを使用できます。

  • OOBIndices

  • OOBInstanceWeight

このフラグが真の場合、次のメソッドを呼び出すことができます。

  • oobError

  • oobMargin

  • oobMeanMargin

oobErrorOOBIndicesOOBInstanceWeightoobMarginoobMeanMargin も参照してください。

ComputeOOBVarImp

変数の重要度の out-of-bag 推定を計算するかどうかを指定する論理フラグです。既定の設定は false です。このフラグが true の場合、ComputeOOBPrediction も true になります。

このフラグが true の場合、次のプロパティを使用できます。

  • OOBPermutedVarDeltaError

  • OOBPermutedVarDeltaMeanMargin

  • OOBPermutedVarCountRaiseMargin

Cost

誤判別のコストの行列です。回帰木の集団の場合、このプロパティは空です。

DefaultYfit

predictoobPredict が返す既定値。DefaultYfit プロパティで、予測が不可能な場合にどのような予測値を返すかを指定します。たとえば、oobPredict で集団のすべてのツリーで in-bag である観測の予測を行う必要があるとします。

  • 分類では、このプロパティを '' または 'MostPopular' に設定できます。'MostPopular' (既定の設定) を選択すると、プロパティ値は学習データの中で最も可能性の高いクラスの名前になります。'' を選択すると、in-bag の観測値が out-of-bag の誤差およびマージンの計算から除外されます。

  • 回帰では、このプロパティを任意のスカラー値に設定できます。既定値は学習データの応答値の平均です。このプロパティを NaN に設定すると、in-bag の観測が out-of-bag の誤差およびマージンの計算から除外されます。

DeltaCritDecisionSplit

各変数での分離基準を分離全体で合計して、成長したツリーの集団全体で平均した値の変化を示す、サイズが 1 行 Nvars 列の数値配列です。

ClassificationTree.predictorImportance および RegressionTree.predictorImportance のリファレンス ページも参照してください。

FBoot

ブートストラップ複製ごとの置き換えによって無作為に選択される、観測の割合。各複製のサイズは、Nobs × FBoot により指定されます。Nobs は、学習セット内の観測数です。既定値は 1 です。

MergeLeaves

同じ親をもつ決定木の葉を、総リスクを減少させない分割のためにマージするかどうかを指定する論理フラグ。既定値は false です。

Method

ツリーで使用されるメソッド。分類集団には 'classification'、回帰集団には 'regression' の値を使用できます。

MinLeaf

ツリー リーフ 1 枚あたりの観測値の最小個数。MinLeaf の既定の設定は、分類の場合は 1、回帰の場合は 5 です。決定木のトレーニングでは、MinParent 値を 2*MinLeaf に設定する必要があります。

NTrees

集団内の決定木の数と等しいスカラー値。

NVarSplit

1 行Nvars 列のサイズの数値配列で、各要素が出力するこの予測子の分割数を合計すると、すべてのツリーになります。

NVarToSample

各決定分割で無作為に選択する予測子変数または特徴変数の個数。既定では、NVarToSample は分類の場合は変数の総数の平方根、回帰の場合は変数の総数の 3 分の 1 に設定されています。

OOBIndices

Nobs 行 NTrees 列の論理配列。Nobs は学習データの観測数、NTrees は集団内のツリーの数です。(i,j) 要素の値が true の場合、観測 i がツリー j について out-of-bag であることを示します。つまり、観測 i がツリー j を成長させるための学習データとして選択されなかったことを意味します。

OOBInstanceWeight

観測ごとの out-of-bag 応答を計算するために使用されたツリーの数を含む、Nobs 行 1 列の数値配列。Nobs は集団の作成に使用された学習データの観測数です。

OOBPermutedVarCountRaiseMargin

予測子変数 (特徴) ごとの変数重要度の測定値を含む 1 行 Nvars 列のサイズの数値配列です。いずれの変数の場合も、その変数の値が out-of-bag 観測で並べ替えられる場合、測度は高いマージン数と低いマージン数とで異なります。この測定値はツリーごとに計算され、集団全体で平均化されてから、集団全体の標準偏差で除算されます。回帰木の場合、このプロパティは空です。

OOBPermutedVarDeltaError

予測子変数 (特徴) ごとの重要度の測定値を含む 1 行 Nvars 列のサイズの数値配列です。いずれの変数の場合も、その変数の値が out-of-bag 観測で並べ替えられた場合、測度は予測誤差の増加です。この測定値はツリーごとに計算され、集団全体で平均化されてから、集団全体の標準偏差で除算されます。

OOBPermutedVarDeltaMeanMargin

予測子変数 (特徴) ごとの重要度の測定値を含む 1 行 Nvars 列のサイズの数値配列です。いずれの変数の場合も、その変数の値が out-of-bag 観測で並べ替えられた場合、測度は分類マージンにおける減少です。この測定値はツリーごとに計算され、集団全体で平均化されてから、集団全体の標準偏差で除算されます。回帰木の場合、このプロパティは空です。

OutlierMeasure

Nobs 行 1 列のサイズの数値配列です。ここで、Nobs は、学習データの観測数で、観測ごとの外れ値の測度を含んでいます。

CompactTreeBagger.OutlierMeasure も参照してください。

Prior

クラスの前の確率をもつベクトル。回帰木の集団の場合、このプロパティは空です。

Proximity

Nobs 行 Nobs 列のサイズの数値行列です。Nobs は学習データ内の観測値の数で、観測値間の近似の測度を含んでいます。任意の 2 つの観測値における近似は、これらの観測値がツリーの同じリーフに着地する割合として定義されます。これは、1 の対角要素と 0 ~ 1 の範囲の非対角要素をもつ対称行列です。

CompactTreeBagger.proximity も参照してください。

Prune

Prune プロパティは、決定木が枝刈りされる場合に true となり、枝刈りされない場合に false となります。集団については、決定木を枝刈りすることは推奨しません。既定値は false です。

ClassificationTree.prune および RegressionTree.prune のリファレンス ページも参照してください。

SampleWithReplacement

置き換えで決定木ごとにデータが標本化されるかどうかを指定する論理フラグです。TreeBagger が置き換えでデータを標本化する場合は true、それ以外は false となります。既定値は true です。

TreeArgs

fitctree または fitrtree 用の引数のセル配列これらの引数は集団用に新しいツリーを成長させるために TreeBagger によって使用されます。

Trees

集団内のツリーを格納するサイズ NTrees 行 1 列のセル配列です。

NTrees も参照してください。

VarAssoc

Nvars 行 Nvars 列のサイズをもち、変数の関連付けの予測測定を成長したツリーの集団全体で平均化した行列。集団の設定を 'surrogate' から 'on' にすると、各ツリーのこの行列には、サロゲート分割で平均化された関連付けの予測測定が入力されます。集団設定を 'surrogate' から 'off' (既定値) にした場合、VarAssoc は対角行列になります。

VarNames

予測子変数 (特徴) の名前を格納するセル配列。TreeBagger は、これらの名前をオプションの 'names' パラメーターから取得します。既定の名前は'x1''x2' などです。

W

長さ Nobs の重みの数値ベクトル。ここで Nobs は学習データの観測 (行) 数です。TreeBagger は集団ですべての決定木を成長させるために、これらの重みを使用します。既定の設定の Wones(Nobs,1) です。

X

Nobs 行 Nvars 列の数値行列です。ここで、Nobs は観測数 (行) であり、Nvars は学習データ内の変数の数 (列) です。この行列は、予測子 (または特徴) の値を保持します。

Y

分類の true のクラス ラベルまたは回帰の応答値の配列です。Y は、数値列ベクトル、文字行列、文字列のセル配列のいずれかです。

コピーのセマンティクス

値。これがクラスの使用に与える影響については、『MATLAB® オブジェクト指向プログラミング』ドキュメンテーションの「ハンドル クラスと値クラスの比較」を参照してください。

この情報は役に立ちましたか?