Main Content

ClassificationEnsemble

パッケージ: classreg.learning.classif
スーパークラス: CompactClassificationEnsemble

アンサンブル分類器

説明

ClassificationEnsemble は、学習済みの弱学習器モデルのセット、およびそれらの学習器が学習を行ったデータを結合します。この関数では、弱学習器からの予測を集約することにより、新しいデータに対するアンサンブル応答を予測できます。学習に使用したデータが格納され、再代入予測を計算することができ、必要な場合は学習を再開できます。

構築

アンサンブル分類オブジェクト (ens) を作成するには、fitcensemble を使用します。

プロパティ

BinEdges

数値予測子のビンのエッジ。p 個の数値ベクトルが含まれている cell 配列を指定します。p は予測子の個数です。各ベクトルには、数値予測子のビンのエッジを含めます。カテゴリカル予測子はビン化されないので、カテゴリカル予測子の場合は、この cell 配列の要素を空にします。

数値予測子がビン化されるのは、木学習器を使用してモデルに学習をさせるときに名前と値の引数 'NumBins' として正の整数スカラーを指定した場合だけです。'NumBins' の値が空 (既定) である場合、BinEdges プロパティは空になります。

学習済みモデル mdlBinEdges プロパティを使用することにより、ビン化された予測子データ Xbinned を再現できます。

X = mdl.X; % Predictor data
Xbinned = zeros(size(X));
edges = mdl.BinEdges;
% Find indices of binned predictors.
idxNumeric = find(~cellfun(@isempty,edges));
if iscolumn(idxNumeric)
    idxNumeric = idxNumeric';
end
for j = idxNumeric 
    x = X(:,j);
    % Convert x to array if x is a table.
    if istable(x) 
        x = table2array(x);
    end
    % Group x into bins by using the discretize function.
    xbinned = discretize(x,[-inf; edges{j}; inf]); 
    Xbinned(:,j) = xbinned;
end
数値予測子の場合、1 からビンの個数までの範囲にあるビンのインデックスが Xbinned に格納されます。カテゴリカル予測子の場合、Xbinned の値は 0 になります。XNaN が含まれている場合、対応する Xbinned の値は NaN になります。

CategoricalPredictors

カテゴリカル予測子のインデックス。正の整数のベクトルとして指定します。CategoricalPredictors には、対応する予測子がカテゴリカルであることを示すインデックス値が格納されます。インデックス値の範囲は 1 ~ p です。p はモデルの学習に使用した予測子の数です。どの予測子もカテゴリカルではない場合、このプロパティは空 ([]) になります。

ClassNames

重複が削除された Y の要素のリスト。ClassNames には、数値ベクトル、categorical ベクトル、logical ベクトル、文字配列、文字ベクトルの cell 配列のいずれかを指定できます。ClassNames のデータ型は、引数 Y のデータ型と同じです。(string 配列は文字ベクトルの cell 配列として扱われます)。

CombineWeights

ens による弱学習器の重みの結合法を説明する文字ベクトル。'WeightedSum' または 'WeightedAverage' のどちらかになります。

Cost

正方行列。Cost(i,j) は真のクラスが i である点をクラス j に分類するコストです (行は真のクラス、列は予測したクラスに対応します)。Cost の行と列の順序は、ClassNames のクラスの順序に対応します。Cost の行および列の数は、応答に含まれている一意なクラスの数です。このプロパティは読み取り専用です。

ExpandedPredictorNames

展開された予測子名。文字ベクトルの cell 配列として格納されます。

モデルがカテゴリカル変数用のエンコーディングを使用している場合、ExpandedPredictorNames には展開された変数を表す名前が格納されます。それ以外の場合、ExpandedPredictorNamesPredictorNames と同じです。

FitInfo

近似情報の数値配列。FitInfoDescription プロパティは、この配列の内容を記述します。

FitInfoDescription

配列 FitInfo の意味を表す文字ベクトル。

HyperparameterOptimizationResults

ハイパーパラメーターの交差検証最適化の説明。BayesianOptimization オブジェクト、またはハイパーパラメーターおよび関連する値が含まれているテーブルとして格納されます。作成時に名前と値のペア OptimizeHyperparameters が空ではない場合、これは空ではありません。値は、作成時の名前と値のペア HyperparameterOptimizationOptions の設定によって決まります。

  • 'bayesopt' (既定) — BayesianOptimization クラスのオブジェクト

  • 'gridsearch' または 'randomsearch' — 使用したハイパーパラメーター、観測された目的関数の値(交差検証損失)、および最低 (最良) から最高 (最悪) までの観測値の順位が格納されているテーブル

LearnerNames

アンサンブルに含まれている弱学習器の名前をもつ文字ベクトルの cell 配列。各学習器の名前は一度だけ現れます。たとえば、ツリーが 100 本のアンサンブルの場合は、LearnerNames{'Tree'} になります。

Method

ens を作成する方法を表す文字ベクトル。

ModelParameters

ens の学習に使用されるパラメーター。

NumObservations

学習データにある観測値の数を含む数値スカラー。

NumTrained

ens の学習済みの弱学習器の数、スカラー。

PredictorNames

予測子変数の名前の cell 配列。並びは X に現れる順です。

Prior

各クラスの事前確率の数値ベクトル。Prior の要素の順序は、ClassNames のクラスの順序に対応します。Prior の要素数は、応答に含まれている一意なクラスの数です。このプロパティは読み取り専用です。

ReasonForTermination

fitcensemble がアンサンブルへの弱学習器の追加を停止した理由を表す文字ベクトル。

ResponseName

応答変数 Y の名前をもつ文字ベクトル。

RowsUsed

モデルに格納されている元の学習データの行。logical ベクトルとして指定します。このプロパティは、XY にすべての行が格納される場合は空になります。

ScoreTransform

スコア変換用の関数ハンドル、または組み込みの変換関数を表す文字ベクトル。'none' は変換なしを意味します。等価的には、'none'@(x)x です。組み込みの変換関数のリストとカスタム変換関数の構文は、fitctree を参照してください。

ドット表記を使用して関数 ScoreTransform を追加または変更します。

ens.ScoreTransform = 'function'

または

ens.ScoreTransform = @function

Trained

学習済み分類モデルの cell ベクトル。

  • Method'LogitBoost' または 'GentleBoost' の場合、ClassificationEnsembleTrained{j} に格納されているオブジェクトの CompactRegressionLearner プロパティに学習済みの学習器 j を格納します。つまり、学習済み学習器 j にアクセスするには、ens.Trained{j}.CompactRegressionLearner を使用します。

  • それ以外の場合、対応するコンパクトな分類モデルが cell ベクトルのセルに格納されます。

TrainedWeights

ens の弱学習器のための学習済み重みを表す数値ベクトル。 TrainedWeights には T 個の要素があり、Tlearners の弱学習器の数を表します。

UsePredForLearner

サイズ PNumTrained 列の logical 行列であり、ここで、P は学習データ X の予測子 (列) の数です。UsePredForLearner(i,j) は、学習器 j が予測子 i を使用するときに true になり、それ以外の場合は false になります。それぞれの学習器に対して、予測子は学習データ X の列と同じ順序になります。

アンサンブルが Subspace 型ではない場合、UsePredForLearner 内のすべてのエントリは true です。

W

スケールされた weights、長さ n のベクトル、X の行の数。W の要素の合計は 1 です。

X

アンサンブルに学習させた予測子の値の行列または table。X の各列が 1 つの変数を表し、各行が 1 つの観測値を表します。

Y

数値ベクトル、categorical ベクトル、logical ベクトル、文字配列、または文字ベクトルの cell 配列。Y の各行は、X の対応する行の分類を表します。

オブジェクト関数

compactアンサンブル分類モデルのサイズの縮小
compareHoldout新しいデータを使用して 2 つの分類モデルの精度を比較
crossvalアンサンブル分類モデルの交差検証
edgeアンサンブル分類モデルの分類エッジ
gatherGPU からの Statistics and Machine Learning Toolbox オブジェクトのプロパティの収集
limeLocal Interpretable Model-agnostic Explanations (LIME)
lossアンサンブル分類モデルの分類損失
marginアンサンブル分類モデルの分類マージン
partialDependence部分依存の計算
plotPartialDependence部分依存プロット (PDP) および個別条件付き期待値 (ICE) プロットの作成
predict分類モデルのアンサンブルを使用して観測値を分類
predictorImportance決定木の分類アンサンブルに関する予測子の重要度の推定
resubEdgeアンサンブル分類モデルの再代入分類エッジ
resubLossアンサンブル分類モデルの再代入分類損失
resubMarginアンサンブル分類モデルの再代入分類マージン
resubPredictアンサンブル分類モデルの観測値の分類
resumeアンサンブル分類モデルの学習の再開
shapleyシャープレイ値
testckfold交差検証の反復により 2 つの分類モデルの精度を比較

コピーのセマンティクス

値。値のクラスがコピー操作に与える影響については、オブジェクトのコピーを参照してください。

すべて折りたたむ

ionosphere データセットを読み込みます。

load ionosphere

すべての測定値と AdaBoostM1 メソッドを使用して、100 本の分類木があるブースティング アンサンブルに学習をさせます。

Mdl = fitcensemble(X,Y,'Method','AdaBoostM1')
Mdl = 
  ClassificationEnsemble
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351
               NumTrained: 100
                   Method: 'AdaBoostM1'
             LearnerNames: {'Tree'}
     ReasonForTermination: 'Terminated normally after completing the requested number of training cycles.'
                  FitInfo: [100x1 double]
       FitInfoDescription: {2x1 cell}


MdlClassificationEnsemble モデル オブジェクトです。

Mdl.Trained は、アンサンブルを構成する学習済み分類木 (CompactClassificationTree モデル オブジェクト) の 100 行 1 列の cell ベクトルが格納されているプロパティです。

1 番目の学習済み分類木のグラフをプロットします。

view(Mdl.Trained{1},'Mode','graph')

Figure Classification tree viewer contains an axes object and other objects of type uimenu, uicontrol. The axes object contains 36 objects of type line, text. One or more of the lines displays its values using only markers

既定の設定では、fitcensemble は木のブースティング アンサンブルに対して浅い木を成長させます。

X の平均のラベルを予測します。

predMeanX = predict(Mdl,mean(X))
predMeanX = 1x1 cell array
    {'g'}

ヒント

分類木のアンサンブルの場合、コンパクトな分類モデルから成る ens.NumTrained 行 1 列の cell ベクトルが ensTrained プロパティに格納されます。cell ベクトルの木 t をテキストまたはグラフィックで表示するには、以下を入力します。

  • LogitBoost または GentleBoost を使用して集約したアンサンブルの場合は「view(ens.Trained{t}.CompactRegressionLearner)」。

  • 他のすべての集約方法の場合は「view(ens.Trained{t})」。

拡張機能

バージョン履歴

R2011a で導入

すべて展開する