Main Content

RegressionEnsemble

説明

RegressionEnsemble は、学習済みの弱学習器モデルのセット、およびそれらの学習器が学習を行ったデータを結合します。この関数では、弱学習器からの予測を集約することにより、新しいデータに対するアンサンブル応答を予測できます。

作成

説明

アンサンブル回帰オブジェクトを作成するには、fitrensemble を使用します。

プロパティ

すべて展開する

この プロパティ は読み取り専用です。

数値予測子のビンのエッジ。p 個の数値ベクトルが含まれている cell 配列を指定します。p は予測子の個数です。各ベクトルには、数値予測子のビンのエッジを含めます。カテゴリカル予測子はビン化されないので、カテゴリカル予測子の場合は、この cell 配列の要素を空にします。

数値予測子がビン化されるのは、木学習器を使用してモデルに学習をさせるときに名前と値の引数 'NumBins' として正の整数スカラーを指定した場合だけです。'NumBins' の値が空 (既定) である場合、BinEdges プロパティは空になります。

学習済みモデル mdlBinEdges プロパティを使用することにより、ビン化された予測子データ Xbinned を再現できます。

X = mdl.X; % Predictor data
Xbinned = zeros(size(X));
edges = mdl.BinEdges;
% Find indices of binned predictors.
idxNumeric = find(~cellfun(@isempty,edges));
if iscolumn(idxNumeric)
    idxNumeric = idxNumeric';
end
for j = idxNumeric 
    x = X(:,j);
    % Convert x to array if x is a table.
    if istable(x) 
        x = table2array(x);
    end
    % Group x into bins by using the discretize function.
    xbinned = discretize(x,[-inf; edges{j}; inf]); 
    Xbinned(:,j) = xbinned;
end
数値予測子の場合、1 からビンの個数までの範囲にあるビンのインデックスが Xbinned に格納されます。カテゴリカル予測子の場合、Xbinned の値は 0 になります。XNaN が含まれている場合、対応する Xbinned の値は NaN になります。

この プロパティ は読み取り専用です。

カテゴリカル予測子のインデックス。正の整数のベクトルとして指定します。CategoricalPredictors には、対応する予測子がカテゴリカルであることを示すインデックス値が格納されます。インデックス値の範囲は 1 ~ p です。p はモデルの学習に使用した予測子の数です。どの予測子もカテゴリカルではない場合、このプロパティは空 ([]) になります。

データ型: single | double

この プロパティ は読み取り専用です。

アンサンブルでの弱学習器の重みの結合方法。'WeightedAverage' または 'WeightedSum' のいずれかとして返されます。

データ型: char

この プロパティ は読み取り専用です。

展開された予測子名。文字ベクトルの cell 配列として返されます。

モデルがカテゴリカル変数用のエンコーディングを使用している場合、ExpandedPredictorNames には展開された変数を表す名前が格納されます。それ以外の場合、ExpandedPredictorNamesPredictorNames と同じです。

データ型: cell

当てはめの情報。数値配列として返されます。FitInfoDescription プロパティは、この配列の内容を記述します。

データ型: double

FitInfo の情報の説明。文字ベクトルまたは文字ベクトルの cell 配列として返されます。

データ型: char | cell

この プロパティ は読み取り専用です。

ハイパーパラメーターの交差検証最適化の説明。BayesianOptimization オブジェクト、またはハイパーパラメーターと関連する値の table として返されます。作成時に名前と値のペア OptimizeHyperparameters が空ではない場合、これは空ではありません。値は、作成時の名前と値のペア HyperparameterOptimizationOptions の設定によって決まります。

  • 'bayesopt' (既定) — BayesianOptimization クラスのオブジェクト

  • 'gridsearch' または 'randomsearch' — 使用したハイパーパラメーター、観測された目的関数の値(交差検証損失)、および最低 (最良) から最高 (最悪) までの観測値の順位が格納されているテーブル

この プロパティ は読み取り専用です。

アンサンブル内の弱学習器の名前。文字ベクトルの cell 配列として返されます。各学習器の名前は一度だけ現れます。たとえば、ツリーが 100 本のアンサンブルの場合は、LearnerNames{'Tree'} になります。

データ型: cell

fitrensemble がアンサンブルの作成に使用する方法。文字ベクトルとして返されます。

データ型: char

アンサンブルの学習に使用されるパラメーター。EnsembleParams オブジェクトとして返されます。ModelParameters のプロパティには、アンサンブルのタイプ ('classification' または 'regression' のいずれか)、アンサンブルの作成に使用される Method、およびその他のアンサンブルに応じたパラメーターが含まれます。

この プロパティ は読み取り専用です。

学習データ内の観測値の数。正の整数として返されます。入力データまたは応答データに欠損値がある場合、NumObservations は入力データの行数よりも少なくなることがあります。

データ型: double

この プロパティ は読み取り専用です。

アンサンブル内の学習済み弱学習器の数。正の整数として返されます。

データ型: double

この プロパティ は読み取り専用です。

予測子名。文字ベクトルの cell 配列を指定します。PredictorNames のエントリの順序は学習データと同じになります。

データ型: cell

この プロパティ は読み取り専用です。

fitrensemble がアンサンブルへの弱学習器の追加を停止した理由。文字ベクトルとして返されます。

データ型: char

アンサンブルに regularize メソッドを使用した結果。構造体として返されます。Regularization とともに shrink を使用して、再代入誤差を削減し、アンサンブルを縮小します。

データ型: struct

この プロパティ は読み取り専用です。

応答変数の名前。文字ベクトルとして返されます。

データ型: char

生の応答値を変換するための関数。関数ハンドルまたは関数名として指定します。既定の設定は 'none' です。これは @(y)y、つまり変換なしを表します。関数ハンドルは、ベクトル (元の応答値) を受け入れて同じサイズのベクトル (変換した応答値) を返さなければなりません。

例: myfunction = @(y)exp(y) を使用して、指数変換を入力ベクトルに適用する関数のハンドルを作成するとします。この場合、応答変換として 'ResponseTransform',myfunction を指定できます。

データ型: char | string | function_handle

学習済みの回帰モデル。cell ベクトルとして返されます。対応するコンパクトな回帰モデルが cell ベクトルのエントリに格納されます。

Method'LogitBoost' または 'GentleBoost' の場合、アンサンブルは Trained{j} に格納されているオブジェクトの CompactRegressionLearner プロパティに学習済み学習器 j を格納します。つまり、学習済み学習器 j にアクセスするには、ens.Trained{j}.CompactRegressionLearner を使用します。

データ型: cell

この プロパティ は読み取り専用です。

アンサンブル内の弱学習器の学習済みの重み。数値ベクトルとして返されます。TrainedWeights には T 個の要素が含まれます。ここで、Tlearners の弱学習器の数です。アンサンブルは、学習器からの重み付き予測を集約することによって、予測される応答を計算します。

データ型: double

この プロパティ は読み取り専用です。

tree 内のスケーリングされた重み。数値ベクトルとして返されます。W の長さは n (学習データの行数) です。

データ型: double

この プロパティ は読み取り専用です。

予測子の値。実数行列または table として返されます。X の各列が 1 つの変数 (予測子) を表し、各行が 1 つの観測値を表します。

データ型: double | table

この プロパティ は読み取り専用です。

X の行に対応する行の分類。categorical 配列、文字ベクトルの cell 配列、文字配列、logical ベクトル、または数値ベクトルとして返されます。Y の各行は、X の対応する行の分類を表します。

データ型: single | double | logical | char | string | cell | categorical

オブジェクト関数

compactアンサンブル回帰モデルのサイズの縮小
crossval機械学習モデルの交差検証
cvshrinkアンサンブル回帰の枝刈りと正則化の交差検証
gatherGPU からの Statistics and Machine Learning Toolbox オブジェクトのプロパティの収集
limeLocal Interpretable Model-agnostic Explanations (LIME)
lossアンサンブル回帰モデルの回帰誤差
partialDependence部分依存の計算
plotPartialDependence部分依存プロット (PDP) および個別条件付き期待値 (ICE) プロットの作成
predictPredict responses using regression ensemble model
predictorImportance決定木の回帰アンサンブルに関する予測子の重要度の推定
regularizeアンサンブル回帰から学習器に最適な重みを特定する
removeLearnersコンパクト アンサンブル回帰のメンバーの削除
resubLossアンサンブル回帰モデルの再代入損失
resubPredict再代入によるアンサンブル回帰の応答の予測
resumeアンサンブル回帰モデルの学習の再開
shapleyシャープレイ値
shrinkPrune regression ensemble

すべて折りたたむ

carsmall データ セットを読み込みます。重量 (Weight) と気筒数 (Cylinders) を使用して自動車の燃費 (MPG) を説明するモデルを考えます。

load carsmall
X = [Weight Cylinders];
Y = MPG;

LSBoost 法を使用して、100 本の回帰木があるブースティング アンサンブルに学習をさせます。Cylinders がカテゴリカル変数であることを指定します。

Mdl = fitrensemble(X,Y,'Method','LSBoost',...
    'PredictorNames',{'W','C'},'CategoricalPredictors',2)
Mdl = 
  RegressionEnsemble
           PredictorNames: {'W'  'C'}
             ResponseName: 'Y'
    CategoricalPredictors: 2
        ResponseTransform: 'none'
          NumObservations: 94
               NumTrained: 100
                   Method: 'LSBoost'
             LearnerNames: {'Tree'}
     ReasonForTermination: 'Terminated normally after completing the requested number of training cycles.'
                  FitInfo: [100x1 double]
       FitInfoDescription: {2x1 cell}
           Regularization: []


Mdl は、学習データも含まれている RegressionEnsemble モデル オブジェクトです。

Mdl.Trained は、アンサンブルを構成する学習済みの回帰木 (CompactRegressionTree モデル オブジェクト) の 100 行 1 列の cell ベクトルが格納されているプロパティです。

1 番目の学習済み回帰木のグラフをプロットします。

view(Mdl.Trained{1},'Mode','graph')

既定の設定では、fitrensemble は木のブースティング アンサンブルに対して浅い木を成長させます。

気筒数が 4、6、8 である 4,000 ポンドの自動車の燃費を予測します。

XNew = [4000*ones(3,1) [4; 6; 8]];
mpgNew = predict(Mdl,XNew)
mpgNew = 3×1

   19.5926
   18.6388
   15.4810

ヒント

回帰木のアンサンブルの場合、Trained プロパティには ens.NumTrained 個の CompactRegressionTree モデル オブジェクトの cell ベクトルが格納されます。cell ベクトルの木 t をテキストまたはグラフィックで表示するには、次のように入力します。

view(ens.Trained{t})

拡張機能

バージョン履歴

R2011a で導入