ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

predictorImportance

予測子の重要度の推定

構文

imp = predictorImportance(ens)
[imp,ma] = predictorImportance(ens)

説明

imp = predictorImportance(ens) は、アンサンブル内のすべての弱学習器の推定を合計することにより、ens の予測子の重要度の推定を計算します。imp は、このアンサンブルが学習に使用するデータ内にある入力予測子それぞれにつき 1 つの要素をもちます。値が高ければ、ens でこの予測子が重要であることを示します。

[imp,ma] = predictorImportance(ens) は、P 予測子の関連性予測尺度をもつ PP 列の行列を返します。

入力引数

ens

関数 fitrensemble または compact メソッドで作成されたアンサンブル回帰。

出力引数

imp

ens.X での予測子 (列) の数と同じ数の要素をもつ、行ベクトル。このエントリは、予測子の重要度の推定で、0 は、可能な限り最小の重要度を示します。

ma

P 予測子の関連性予測尺度をもつ、PP 列の行列。要素 ma(I,J) は、予測子 I が最適分割予測子となる予測子 J の代理分岐を平均化した関連性予測尺度です。predictorImportance は、アンサンブル内のすべてのツリーにおけるこの関連性予測尺度を平均化します。

すべて展開する

データ内のすべての予測子変数について予測子の重要度を推定します。

carsmall データセットを読み込みます。

load carsmall

AccelerationCylindersDisplacementHorsepowerModel_Year および Weight を予測子として使用して、MPG に対する 100 本の回帰木のアンサンブルを成長させます。弱学習器として木の切り株を指定します。

X = [Acceleration Cylinders Displacement Horsepower Model_Year Weight];
t = templateTree('MaxNumSplits',1);
ens = fitrensemble(X,MPG,'Method','LSBoost','Learners',t);

すべての予測子変数について予測子の重要度を推定します。

imp = predictorImportance(ens)
imp = 1×6

    0.0150         0    0.0066    0.1111    0.0437    0.5181

最後の予測子 Weight は、燃費に対する影響が最も大きくなっています。2 番目の予測子の重要度は 0 です。これは、ens による予測に気筒数が影響を与えないことを意味します。

代理分岐が含まれているアンサンブル回帰木で、データに含まれているすべての変数について予測子の重要度を推定します。

carsmall データセットを読み込みます。

load carsmall

AccelerationCylindersDisplacementHorsepowerModel_Year および Weight を予測子として使用して、MPG に対する 100 本の回帰木のアンサンブルを成長させます。弱学習器として木の切り株を指定し、代理分岐も指定します。

X = [Acceleration Cylinders Displacement Horsepower Model_Year Weight];
t = templateTree('MaxNumSplits',1,'Surrogate','on');
ens = fitrensemble(X,MPG,'Method','LSBoost','Learners',t);

すべての予測子変数について予測子の重要度と関連性予測尺度を推定します。

[imp,ma] = predictorImportance(ens)
imp = 1×6

    0.2065    0.3799    0.4100    0.6190    0.3670    0.5476

ma = 6×6

    1.0000    0.0098    0.0102    0.0098    0.0033    0.0067
         0    1.0000         0         0         0         0
    0.0056    0.0084    1.0000    0.0078    0.0022    0.0084
    0.2232    0.1574    0.2066    1.0000    0.0580    0.2059
    0.0061    0.0070    0.0063    0.0064    1.0000    0.0056
    0.0200    0.0368    0.0620    0.0521    0.0098    1.0000

imp予測子の重要度の推定の結果と比較すると、燃費に対する影響が最も大きいのは Horsepower、2 番目に影響が大きいのは Weight になっています。

詳細

すべて展開する

アルゴリズム

要素 ma(i,j) は、予測子 j が最適分割予測子となる予測子 i の代理分岐を平均化した関連性予測尺度です。この平均は、予測子 i の最適分割、および予測子 j の代理分岐における関連性予測尺度の正の値を合計し、予測子 ij 間の関連性予測尺度が負になる分割も含めた、予測子 i の最適分割の合計数で除算することによって計算されます。