Main Content

次元削減と特徴抽出

PCA、因子分析、特徴選択、特徴抽出など

"特徴変換" 手法では、データを新しい特徴量に変換することによりデータの次元を減らします。"特徴選択" 手法は、カテゴリカル変数がデータに含まれている場合など、変数を変換できない場合に適しています。特に最小二乗近似に適している特徴選択手法については、ステップワイズ回帰を参照してください。

ライブ エディター タスク

次元削減ライブ エディターでの主成分分析 (PCA) を使用した次元削減 (R2022b 以降)

関数

すべて展開する

fscchi2カイ二乗検定を使用した分類に向けた一変量の特徴量ランク付け (R2020a 以降)
fscmrmrMinimum Redundancy Maximum Relevance (MRMR) アルゴリズムを使用した分類用の特徴量のランク付け (R2019b 以降)
fscnca分類に近傍成分分析を使用する特徴選択
fsrftestF 検定を使用した回帰のための一変量の特徴量ランク付け (R2020a 以降)
fsrmrmrMinimum Redundancy Maximum Relevance (MRMR) アルゴリズムを使用した回帰用の特徴量のランク付け (R2022a 以降)
fsrnca回帰に近傍成分分析を使用する特徴選択
fsulaplacianラプラシアン スコアを使用して教師なし学習の特徴量をランク付け (R2019b 以降)
partialDependence部分依存の計算 (R2020b 以降)
plotPartialDependence部分依存プロット (PDP) および個別条件付き期待値 (ICE) プロットの作成
oobPermutedPredictorImportance分類木のランダム フォレストに対する out-of-bag 予測子の並べ替えによる予測子の重要度の推定
oobPermutedPredictorImportance回帰木のランダム フォレストに対する out-of-bag 予測子の並べ替えによる予測子の重要度の推定
predictorImportance分類木の予測子の重要度の推定
predictorImportance決定木の分類アンサンブルに関する予測子の重要度の推定
predictorImportanceEstimates of predictor importance for regression tree
predictorImportance決定木の回帰アンサンブルに関する予測子の重要度の推定
relieffReliefF または RReliefF アルゴリズムを使用した予測子の重要度のランク付け
sequentialfsカスタム基準を使用した逐次特徴選択
stepwiselmステップワイズ回帰の実行
stepwiseglmステップワイズ回帰による一般化線形回帰モデルの作成
rica再構成 ICA の使用による特徴抽出
sparsefiltスパース フィルターの使用による特徴抽出
transform抽出された特徴量への予測子の変換
tsnet 分布型確率的近傍埋め込み
barttestバートレットの検定
canoncorr正準相関
pca生データの主成分分析
pcacov共分散行列の主成分分析
pcares主成分分析の残差
ppca確率的主成分分析
factoran因子分析
rotatefactors因子負荷量の回転
nnmf非負値行列因子分解
cmdscale古典的多次元尺度構成法
mahal基準標本に対するマハラノビス距離
mdscale非古典的多次元尺度構成法
pdist観測値ペア間のペアワイズ距離
squareform距離行列の形式
procrustesプロクラステス解析

オブジェクト

すべて展開する

FeatureSelectionNCAClassification近傍成分分析 (NCA) を使用する分類用の特徴選択
FeatureSelectionNCARegression近傍成分分析 (NCA) を使用する回帰用の特徴選択
ReconstructionICA再構成 ICA による特徴抽出
SparseFilteringスパース フィルターによる特徴抽出

トピック

特徴選択

特徴抽出

  • 特徴抽出
    特徴抽出は、高レベルの特徴をデータから抽出する一連の方法です。
  • 特徴抽出のワークフロー
    この例では、イメージ データからの特徴抽出を行う完全なワークフローを示します。
  • 混合信号の抽出
    この例では、rica を使用して混合オーディオ信号を分離する方法を示します。

t-SNE 多次元可視化

  • t-SNE
    t-SNE は、元のデータの一部の特徴量を保持したまま 2 または 3 次元への非線形削減を行うことにより高次元データを可視化する方法です。
  • t-SNE の使用による高次元データの可視化
    この例では、高次元データの有用な低次元埋め込みを t-SNE で作成する方法を示します。
  • tsne の設定
    この例では、さまざまな tsne の設定の影響を示します。
  • t-SNE の出力関数
    出力関数の説明と t-SNE の例です。

PCA と正準相関

因子分析

  • 因子分析
    因子分析は、多変量データにモデルを当てはめることにより、少数の観測されない (潜在的な) 因子に対する測定された変数の相互依存を推定する方法です。
  • 因子分析の使用による株価の分析
    因子分析を使用して、同じ部門の会社では株価が週単位で同じように変化しているかどうかを調べます。
  • 試験の成績に対する因子分析の実行
    この例では、Statistics and Machine Learning Toolbox™ を使用してクラスター分析を実行する方法を示します。

非負値行列因子分解

  • 非負値行列因子分解
    "非負値行列因子分解" ("NMF") は、特徴空間の低ランク近似に基づく次元削減手法です。
  • 非負値行列因子分解の実行
    乗法アルゴリズムおよび交互最小二乗アルゴリズムを使用して非負値行列因子分解を実行します。

多次元尺度構成法

プロクラステス解析