モデルの作成と評価
高品質の予測分類モデルを構築するには、正しい特徴量 (予測子) の選択とハイパーパラメーター (推定されないモデル パラメーター) の調整を行うことが重要です。
特徴選択とハイパーパラメーター調整により複数のモデルが生成されます。k 分割誤分類率、受信者動作特性 (ROC) 曲線または混同行列をモデル間で比較できます。または、統計的検定を実施して、ある分類モデルの性能が他の分類モデルに対して有意に優れているかどうかを調べます。
分類モデルに学習させる前に新しい特徴量を設計するには、gencfeatures
を使用します。
分類モデルの構築と評価を対話的に行うには、分類学習器アプリを使用します。
調整されたハイパーパラメーターでモデルを自動的に選択するには、fitcauto
を使用します。この関数は、分類モデルのタイプの選択をさまざまなハイパーパラメーターの値で試し、新しいデータで適切に実行されることが期待される最終モデルを返します。データに最適な分類器のタイプがわからない場合は、fitcauto
を使用します。
特定のモデルのハイパーパラメーターを調整するには、ハイパーパラメーターの値を選択し、この値を使用してモデルを交差検証します。たとえば、SVM モデルを調整するには、一連のボックス制約およびカーネル スケールを選択し、値の各ペアについてモデルを交差検証します。Statistics and Machine Learning Toolbox™ の一部の分類関数では、ベイズ最適化、グリッド探索またはランダム探索による自動的なハイパーパラメーター調整が提供されます。ベイズ最適化を実装するための main 関数である bayesopt
は、他の多くの用途にも応用が利きます。ベイズ最適化のワークフローを参照してください。
分類モデルを解釈するために、lime
、shapley
および plotPartialDependence
を使用できます。
アプリ
分類学習器 | 教師あり機械学習を使用して、データを分類するようにモデルを学習させる |
関数
オブジェクト
プロパティ
ConfusionMatrixChart のプロパティ | 混同行列チャートの外観と動作 |
ROCCurve のプロパティ | 受信者動作特性 (ROC) 曲線の外観と動作 |
トピック
分類学習器アプリ
- 分類学習器アプリにおける分類モデルの学習
自動、手動および並列学習など、分類モデルの学習、比較および改善を行うためのワークフローです。 - 分類学習器における分類器の性能の可視化と評価
モデルの精度の値を比較し、クラスの予測をプロットすることにより結果を可視化し、混同行列でクラスごとの性能をチェックする。 - 分類学習器アプリの使用による特徴選択と特徴変換
分類学習器で、プロットまたは特徴ランク付けアルゴリズムを使用して有用な予測子を識別し、含める特徴量を選択し、PCA を使用して特徴量を変換する。
特徴選択
- 特徴選択の紹介
特徴選択アルゴリズムについて学び、特徴選択に使用できる関数を確認します。 - 逐次特徴選択
このトピックでは、逐次特徴選択の基本を説明し、カスタム基準と関数sequentialfs
を使用して逐次的に特徴量を選択する例を示します。 - 近傍成分分析 (NCA) 特徴選択
近傍成分分析 (NCA) は、特徴量を選択するためのノンパラメトリックな手法であり、回帰および分類アルゴリズムの予測精度を最大化することを目的とします。 - 分類に NCA を使用して特徴量を判別するための正則化パラメーターの調整
この例では、交差検証を使用してfscnca
の正則化パラメーターを調整する方法を示します。 - 判別分析分類器の正則化
モデルの予測力を損なわずに予測子を削除して、よりロバストで簡潔なモデルを作成します。 - 高次元のデータを分類する特徴量の選択
この例では、高次元データを分類するための特徴量を選択する方法を示します。
特徴量エンジニアリング
- 分類用の自動特徴量エンジニアリング
分類モデルに学習させる前にgencfeatures
を使用して新しい特徴を設計する。新しいデータの予測の前に同じ特徴変換を新しいデータ セットに適用する。
自動モデル選択
- ベイズ最適化および ASHA 最適化による分類器の自動選択
fitcauto
を使用し、指定した学習予測子と応答データに基づいてさまざまなハイパーパラメーターの値をもつ分類モデルのタイプの選択を自動的に試します。
ハイパーパラメーターの最適化
- ベイズ最適化のワークフロー
近似関数を使用するかbayesopt
を直接呼び出してベイズ最適化を実行します。 - ベイズ最適化用の変数
ベイズ最適化用の変数を作成します。 - ベイズ最適化の目的関数
ベイズ最適化の目的関数を作成します。 - ベイズ最適化の制約
ベイズ最適化に対してさまざまな種類の制約を設定します。 - bayesopt を使用した交差検証分類器の最適化
ベイズ最適化を使用して交差検証損失を最小化します。 - ベイズ最適化の使用による分類器の当てはめの最適化
近似関数で名前と値の引数OptimizeParameters
を使用して交差検証損失を最小化する。 - ベイズ最適化のプロット関数
ベイズ最適化を視覚的に監視します。 - ベイズ最適化の出力関数
ベイズ最適化を監視します。 - ベイズ最適化のアルゴリズム
ベイズ最適化の基となるアルゴリズムについて理解します。 - 並列ベイズ最適化
並列ベイズ最適化はどのように機能するか。
モデルの解釈
- 機械学習モデルの解釈
lime
オブジェクトおよびshapley
オブジェクトと関数plotPartialDependence
を使用してモデル予測を説明する。 - 機械学習モデルのシャープレイ値
介入型アルゴリズムまたは条件付きアルゴリズムを使用して機械学習モデルのシャープレイ値を計算する。
交差検証
- 並列計算を使用する交差検証の実装
並列計算を使用して交差検証を高速化します。
分類性能の評価
- ROC 曲線とパフォーマンス メトリクス
rocmetrics
を使用してテスト データ セットで分類アルゴリズムの性能を調べる。 - perfcurve による性能曲線
関数perfcurve
で受信者動作特性 (ROC) 曲線を計算する方法を学ぶ。