メインコンテンツ

predictorImportance

決定木の分類アンサンブルに関する予測子の重要度の推定

説明

imp = predictorImportance(ens) は、アンサンブル内のすべての弱学習器の推定を合計することにより、ens の予測子の重要度の推定を計算します。imp には、アンサンブルの学習に使用されたデータ内の入力予測子ごとに 1 つの要素が含まれます。値が高ければ、その予測子が ens で重要であることを示します。

[imp,ma] = predictorImportance(ens) は、ens 内の学習器に代理分岐が含まれる場合に、P 予測子の関連性予測尺度 ma をもつ PP 列の行列を追加で返します。詳細については、予測子の重要度を参照してください。

メモ

予測子の重要度は決定木のアンサンブルについてのみ計算できます。

すべて折りたたむ

フィッシャーのアヤメのデータに含まれるすべての変数について予測子の重要度を推定します。

フィッシャーのアヤメのデータ セットを読み込みます。

load fisheriris

AdaBoostM2 を使用してアンサンブル分類に学習させます。弱学習器として木の切り株を指定します。

t = templateTree(MaxNumSplits=1);
ens = fitcensemble(meas,species,Method="AdaBoostM2",Learners=t);

すべての予測子変数について予測子の重要度を推定します。

imp = predictorImportance(ens)
imp = 1×4

    0.0004    0.0016    0.1266    0.0324

最初の 2 つの予測子は、アンサンブルでの重要度があまり高くありません。

木に代理分岐が含まれているアンサンブルで、フィッシャーのアヤメのデータに含まれるすべての変数について予測子の重要度を推定します。

フィッシャーのアヤメのデータ セットを読み込みます。

load fisheriris

AdaBoostM2 を使用して 100 本の分類木のアンサンブルを成長させます。弱学習器として木の切り株を指定し、代理分岐も指定します。

t = templateTree('MaxNumSplits',1,'Surrogate','on');
ens = fitcensemble(meas,species,'Method','AdaBoostM2','Learners',t);

すべての予測子変数について予測子の重要度と関連性予測尺度を推定します。

[imp,ma] = predictorImportance(ens)
imp = 1×4

    0.0674    0.0417    0.1582    0.1537

ma = 4×4

    1.0000         0         0         0
    0.0115    1.0000    0.0022    0.0054
    0.3186    0.2137    1.0000    0.6391
    0.0392    0.0073    0.1137    1.0000

予測子の重要度の推定の解析に比べ、最初の 2 つの予測子の重要度がはるかに高くなっています。

入力引数

すべて折りたたむ

アンサンブル分類モデル。fitcensemble で学習させた ClassificationEnsemble または ClassificationBaggedEnsemble モデル オブジェクト、または compact で作成した CompactClassificationEnsemble モデル オブジェクトとして指定します。

ens.LearnerNames のいずれかのエントリが 'knn' または 'discriminant' である場合、予測子の重要度は計算できません。

出力引数

すべて折りたたむ

予測子の重要度の推定。ens.X の予測子 (列) の数と同じ数の要素をもつ数値行ベクトルとして返されます。このエントリは予測子の重要度の推定で、0 は考えられる最小の重要度を示します。

関連性予測尺度。P 予測子の関連性予測尺度の値をもつ PP 列の行列として返されます。要素 ma(I,J) は、予測子 I が最適分割予測子となる予測子 J の代理分岐を平均化した関連性予測尺度です。predictorImportance は、アンサンブル内のすべての弱学習器におけるこの関連性予測尺度を平均化します。

詳細

すべて折りたたむ

アルゴリズム

要素 ma(i,j) は、予測子 j が最適分割予測子となる予測子 i の代理分岐を平均化した関連性予測尺度です。この平均は、予測子 i の最適分割、および予測子 j の代理分岐における関連性予測尺度の正の値を合計し、予測子 ij 間の関連性予測尺度が負になる分割も含めた、予測子 i の最適分割の合計数で除算することによって計算されます。

拡張機能

すべて展開する

バージョン履歴

R2011a で導入