分類学習器アプリにおける分類モデルの学習

分類学習器を使用して、分類器 (決定木、判別分析、サポートベクターマシン、ロジスティック回帰、最近傍、単純ベイズ、カーネル近似、アンサンブル、ニューラルネットワーク) のモデルに学習をさせます。モデルの学習に加えて、データの探索、特徴量の選択、検証方式の指定、および結果の評価を行うことができます。新しいデータに対してモデルを使用するためにモデルをワークスペースにエクスポートするか、プログラムによる分類について学ぶために MATLAB^® コードを生成することができます。

分類モデルに学習させる場合、アプリでは 2 つのステップが実行されます。

完全なモデルの学習 — 学習データセットでモデルに学習させます。学習データセットは、アプリセッションの開始時にテストデータセットとして確保した部分以外のデータです。
検証モデルの学習 — 検証方式を使用して 1 つ以上のモデルに学習させます。既定では、過適合を防ぐため交差検証が適用されます。あるいは、ホールドアウト検証を指定できます。どちらの方式でも、学習データセットのそれぞれ異なるサブセットを使用して各検証モデルに学習させます。検証モデルのメトリクスと予測の平均を求めることで、最終的な学習済みモデルの検証メトリクスと検証予測が計算されます。検証方式の詳細については、Select Validation Scheme in Classification Learner or Regression Learnerを参照してください。

メモ

アプリによる完全なモデルや検証モデルの学習にテストデータセットは使用されません。モデルテストの詳細については、Test Trained Models in Classification Learner or Regression Learnerを参照してください。

モデルの学習後、検証モデルの平均結果が表示されます。診断尺度 (モデルの精度など) とプロット (散布図や混同行列チャートなど) には、検証モデルの結果が反映されます。1 つ以上の分類器の学習を自動的に行い、検証結果を比較し、特定の分類問題に対する最適なモデルを選択できます。テストデータセットを使用する場合は、完全なモデル (学習データセットで学習させたモデル) を使用してテストデータセットメトリクスが計算されます。

モデルを選択してワークスペースにエクスポートすると、完全なモデルがエクスポートされます。分類学習器は学習時に完全なモデルのモデルオブジェクトを作成するので、すぐにモデルをエクスポートできます。エクスポートしたモデルを使用して、新しいデータに対して予測を行うことができます。

選択したタイプのモデルに学習をさせることから始める場合は、自動化された分類器の学習を参照してください。学習させる分類器のタイプが既にわかっている場合は、手動による分類器の学習を参照してください。

自動化された分類器の学習

分類学習器を使用すると、データに対して、選択した各種の分類モデルに自動的に学習をさせることができます。

複数のモデルの同時学習の自動化から始めます。選択したモデルを素早く試し、その後、有望なモデルを対話的に探すことができます。
必要な分類器が既にわかっている場合は、代わりに個々の分類器に学習をさせます。手動による分類器の学習を参照してください。

[アプリ] タブの [機械学習および深層学習] グループで [分類学習器] をクリックして分類学習器アプリを開きます。
[学習] タブの [ファイル] セクションで [新規セッション] をクリックし、[ワークスペースデータから] または [データファイルから] を選択します。応答変数と、予測子として使用する変数を指定します。あるいは、[開く] をクリックして前に保存したアプリセッションを開きます。Start a Classification Learner or Regression Learner Sessionを参照してください。
[モデル] セクションで [すべてのクイック学習] を選択します。このオプションは、選択したデータセットに利用可能な、事前設定されている、当てはめに手間のかからないすべてのモデルに学習をさせます。
[学習] セクションで、[すべてを学習] をクリックして [すべてを学習] を選択します。
メモ
Parallel Computing Toolbox™ がある場合、既定ではモデルの学習が並列に実行されます。並列的な分類器の学習を参照してください。
選択されたモデルタイプが [モデル] ペインに表示されます。モデルの学習が終了すると、パーセンテージが最も高い [精度 (検証)] のスコアが四角で囲まれて強調表示されます。
[モデル] ペインでモデルをクリックし、対応するプロットを開いて結果を確認します。
以後の手順については、手動による分類器の学習または分類モデルの比較と改善を参照してください。
選択したデータセットに対して使用できる事前設定済みの最適化不可能な分類器モデルをすべて試すには、[学習] タブの [モデル] セクションで [すべて] をクリックします。
[学習] セクションで、[すべてを学習] をクリックして [選択を学習] を選択します。

手動による分類器の学習

個々の分類器タイプを調べる場合は、分類器を一度に 1 つずつかグループとして学習させることができます。

分類器を選択します。[学習] タブの [モデル] セクションで、分類器のタイプをクリックします。利用可能なすべての分類器を表示するには、[モデル] セクションの右端にある矢印をクリックして分類器のリストを展開します。[モデル] ギャラリーの最適化不可能なモデルオプションは、種々の設定が事前に行われている開始点であり、さまざまな分類問題に適しています。
各分類器の説明を表示するには、詳細表示に切り替えます。

各オプションについての詳細は、分類器のオプションの選択を参照してください。
分類器を選択したら、モデルに学習させることができます。[学習] セクションで、[すべてを学習] をクリックして [選択を学習] を選択します。このプロセスを繰り返してさまざまな分類器を試します。
あるいは、複数のドラフトモデルを作成し、それらのモデルをグループとして学習させることができます。[学習] セクションで、[すべてを学習] をクリックして [すべてを学習] を選択します。
ヒント
はじめは決定木と判別分析を試してください。応答を予測するにはモデルの精度が不十分な場合は、柔軟性が高い他の分類器を試してください。過適合を回避するには、十分な精度が得られる柔軟性が低いモデルを探してください。
同じタイプまたは異なるタイプのすべての最適化不可能なモデルを試す場合、[モデル] ギャラリーで [すべて] のオプションのいずれかを選択します。
あるいは、特定のモデルタイプのハイパーパラメーターを自動的に調整する場合、対応する最適可能なモデルを選択してハイパーパラメーターの最適化を実行します。詳細は、分類学習器アプリのハイパーパラメーターの最適化を参照してください。

以後の手順については、分類モデルの比較と改善を参照してください。

並列的な分類器の学習

Parallel Computing Toolbox がインストールされている場合、分類学習器を使用して並列的にモデルに学習をさせることができます。並列学習を使用すると、同時に複数の分類器に学習をさせ、作業を続行することができます。

並列学習を制御するには、[学習] タブの [学習] セクションで [並列の使用] ボタンを切り替えます。ドラフトモデルに並列に学習させるには、このボタンがオンに切り替わっていることを確認してから [すべてを学習] をクリックします。[並列の使用] ボタンが使用可能になるのは、Parallel Computing Toolbox がある場合だけです。

Use Parallel button in the Train section

[並列の使用] ボタンは既定ではオンになります。[すべてを学習] をクリックして [すべてを学習] または [選択を学習] を初めて選択すると、ダイアログボックスが表示されると同時にワーカーの並列プールが開きます。プールが開いた後で、同時に複数の分類器に学習をさせることができます。

並列的に分類器に学習をさせているときに、[モデル] ペインにある、学習中のモデルと待機中モデルのそれぞれについて、進行状況インジケーターが表示されます。必要な場合は、個々のモデルを取り消すことができます。学習中に、モデルの結果およびプロットを確認したり、別の分類器に学習を開始させることができます。

Parallel Computing Toolbox がある場合、分類学習器で最適化不可能なモデルに対して並列学習が使用可能になり、関数 statset の UseParallel オプションを設定する必要はありません。

メモ

Parallel Computing Toolbox がない場合も、モデル学習中のアプリの応答性を確保できます。ドラフトモデルに学習させる前に、[学習] タブの [学習] セクションで [すべてを学習] をクリックし、[バックグラウンド学習を使用] チェックボックスが選択されていることを確認します。その後、[すべてを学習] オプションを選択します。ダイアログボックスが表示されると同時にバックグラウンドプールが開きます。プールが開いた後、モデルの学習をバックグラウンドで実行しながらアプリの操作を続けることができます。

分類モデルの比較と改善

アプリのいくつかの異なる機能を使用して、学習済み分類モデルを比較して改善できます。

各モデルについて [モデル] ペインに表示される [精度 (検証)] スコアを確認します。[学習] タブの [プロットと結果] セクションで [結果の比較] をクリックします。表示するメトリクスを [データのプロット] の [X] のリストから選択します。
[モデル] ペインでモデルをクリックし、対応するプロットを開いて結果を確認します。プロットで結果を検査して、モデルの性能を比較します。プロットのレイアウトを再編成して複数のモデルの結果を比較できます。[レイアウト] ボタンのオプションを使用するか、プロットをドラッグするか、モデルプロットのタブの右にある [ドキュメントアクション] ボタンに表示されるオプションを選択します。
さらに、[モデル] ペインの [並べ替え] リストを使用して、モデルを比較できます。不要なモデルがあれば、モデルを選択してペインの右上にある [選択したモデルの削除] ボタンをクリックするか、モデルを右クリックして [削除] を選択して削除します。
分類学習器における分類器の性能の可視化と評価を参照してください。
[モデル] ペインから最適なモデルを選択してから、モデルに対するさまざまな特徴量の追加と除外を試します。
まず、モデルを右クリックして [複製] を選択し、最適なモデルのコピーを作成します。
次に、[学習] タブの [オプション] セクションで [特徴選択] をクリックします。使用可能な特徴ランク付けアルゴリズムを使用して特徴量を選択します。
平行座標プロットは、削除する特徴量を識別するために役立ちます。予測力が低い特徴量を削除するとモデルを改善できるかどうか調べます。モデルに含める予測子を指定し、新しいオプションを使用して新しいモデルを学習させます。[モデル] ペインで各モデルの結果を比較します。
PCA で特徴量を変換して次元を削減することもできます。[学習] タブの [オプション] セクションで [PCA] をクリックします。
分類学習器アプリの使用による特徴選択と特徴変換を参照してください。
モデルをさらに改善できるか試すため、モデルを複製してから、モデルの [概要] タブの [モデルのハイパーパラメーター] セクションで分類器のハイパーパラメーターのオプションを変更し、新しいオプションを使用してモデルに学習させることができます。モデルの柔軟性を制御する方法についての詳細は、分類器のオプションの選択を参照してください。モデルのハイパーパラメーターを自動的に調整する方法の詳細については、分類学習器アプリのハイパーパラメーターの最適化を参照してください。
特徴選択、PCA、または新しいハイパーパラメーターの値でモデルが改善される場合は、新しい設定で [すべて] のモデルタイプの学習を試します。別のモデルタイプで新しい設定を使用すると良好な結果が得られるかどうかを調べます。

ヒント

過適合を回避するには、十分な精度が得られる柔軟性が低いモデルを探してください。たとえば、高速で解釈が容易な決定木や判別分析などの単純なモデルを探します。応答を予測するにはモデルの精度が不十分である場合は、柔軟性が高い他の分類器 (アンサンブルなど) を選択します。モデルの柔軟性の詳細については、分類器のオプションの選択を参照してください。

次の図には、アプリと、さまざまなタイプの分類器が含まれている [モデル] ペインが示されています。

Classification Learner app with trained models in the Models pane

異なる分類器を比較する詳しい手順の例については、分類学習器アプリを使用した決定木の学習を参照してください。

以後の手順では、異なるデータでモデルに学習をさせるコードを生成するか、新しいデータを使用して予測を行うために学習済みモデルをワークスペースにエクスポートします。新しいデータを予測するための分類モデルのエクスポートを参照してください。

分類学習器アプリにおける分類モデルの学習

自動化された分類器の学習

手動による分類器の学習

並列的な分類器の学習

分類モデルの比較と改善

参考

トピック