ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

分類学習器アプリにおける分類モデルの学習

分類学習器を使用して、分類器 (決定木、判別分析、サポート ベクター マシン、ロジスティック回帰、最近傍、単純ベイズ、アンサンブル分類) のモデルに学習をさせます。モデルの学習に加えて、データの探索、特徴量の選択、検証方式の指定、および結果の評価を行うことができます。新しいデータに対してモデルを使用するためにモデルをワークスペースにエクスポートするか、プログラムによる分類について学ぶために MATLAB® コードを生成することができます。

分類学習器におけるモデルの学習は、2 つの部分から構成されます。

  • 検証済みモデル: 検証方式を指定してモデルに学習をさせます。既定では、過適合を防ぐため交差検証が適用されます。あるいは、ホールドアウト検定を選択できます。検証済みモデルはアプリに表示されます。

  • フル モデル: 検証を行わず、データ全体に対してモデルに学習をさせます。このモデルの学習は、検証済みモデルの学習と同時に行われます。ただし、データ全体に対して学習をさせたモデルはアプリに表示されません。分類器を選択してワークスペースにエクスポートすると、フル モデルがエクスポートされます。

検証済みモデルの結果が表示されます。診断尺度 (モデルの精度など) とプロット (散布図や混同行列チャートなど) には、検証済みモデルの結果が反映されます。選択した分類器またはすべての分類器の学習を自動的に行い、検証結果を比較し、特定の分類問題に対する最適なモデルを選択できます。モデルを選択してワークスペースにエクスポートすると、フル モデルがエクスポートされます。分類学習器は学習時にフル モデルのモデル オブジェクトを作成するので、すぐにモデルをエクスポートできます。エクスポートしたモデルを使用して、新しいデータに対して予測を行うことができます。

選択したタイプのモデルに学習をさせることから始める場合は、自動化された分類器の学習を参照してください。使用する分類器が既にわかっている場合は、代わりに個々の分類器に学習をさせることができます。手動による分類器の学習を参照してください。

自動化された分類器の学習

分類学習器を使用すると、データに対して、選択した各種の分類モデルに自動的に学習をさせることができます。

  • 複数のモデルの同時学習の自動化から始めます。選択したモデルを素早く試し、その後、有望なモデルを対話的に探すことができます。

  • 必要な分類器が既にわかっている場合は、代わりに個々の分類器に学習をさせます。手動による分類器の学習を参照してください。

  1. [アプリ] タブの [機械学習] グループで [分類学習器] をクリックします。

  2. [新規セッション] をクリックして、ワークスペースまたはファイルからデータを選択します。応答変数と、予測子として使用する変数を指定します。データの選択と分類問題の検証を参照してください。

  3. [分類学習器] タブの [モデル タイプ] セクションで、[すべてのクイック学習] をクリックします。このオプションは、選択したデータセットに利用可能な、事前設定されている、あてはめに手間のかからないすべてのモデルに学習をさせます。

  4. [学習] をクリックします。

    メモ

    Parallel Computing Toolbox™ がインストールされている場合、アプリはモデルに並列的に学習をさせます。並列的な分類器の学習を参照してください。

    選択されたモデル タイプが [履歴] の一覧に表示されます。学習が終了すると、パーセンテージが最も高い [精度] のスコアがボックスで強調表示されます。

  5. [履歴] の一覧でモデルをクリックして、結果をプロットで確認します。

    以後の手順については、手動による分類器の学習または分類モデルの比較と改善を参照してください。

  6. 選択したデータセットに対して使用できる事前設定済みの分類器モデルをすべて試すには、[すべて] をクリックしてから [学習] をクリックします。

手動による分類器の学習

個々のモデル タイプを調べる場合、または必要な分類器のタイプが既にわかっている場合、一度に 1 つずつの分類器に学習をさせるか、同じタイプのグループに学習をさせることができます。

  1. 分類器を選択します。[分類学習器] タブの [モデル タイプ] セクションで、分類器のタイプをクリックします。すべての利用可能な分類器を表示するため、[モデル タイプ] セクションの右端にある矢印をクリックして分類器のリストを展開します。[モデル タイプ] ギャラリーのオプションは、種々の設定が事前に行われている開始点であり、さまざまな分類問題に適しています。

    各分類器の説明を表示するには、詳細表示に切り替えます。

    各オプションについての詳細は、分類器のオプションの選択を参照してください。

  2. 分類器を選択したら、[学習] をクリックします。

    複数の分類器を繰り返し試します。

    ヒント

    はじめは決定木と判別分析を試してください。応答を予測するにはモデルの精度が不十分な場合は、柔軟性が高い他の分類器を試してください。過適合を回避するには、十分な精度が得られる柔軟性が低いモデルを探してください。

  3. すべてのモデル タイプを試す場合、または同じタイプのグループに学習をさせる場合は、[モデル タイプ] ギャラリーで [すべて] のオプションのいずれかを試します。

以後の手順については、分類モデルの比較と改善を参照してください。

並列的な分類器の学習

Parallel Computing Toolbox がインストールされている場合、分類学習器を使用して並列的にモデルに学習をさせることができます。既定の並列設定である [Automatically create a parallel pool] を無効にしない限り、分類器に学習をさせるときにワーカーの並列プールが自動的に起動されます。プールが既に開いている場合、そのプールが学習に使用されます。並列学習を使用すると、同時に複数の分類器に学習をさせ、作業を続行することができます。

  1. はじめて [学習] をクリックすると、ワーカーの並列プールを開くときにダイアログが表示されます。プールが開いた後で、同時に複数の分類器に学習をさせることができます。

  2. 並列的に分類器に学習をさせているときに、[履歴] の一覧の各学習モデルおよびキューに登録されているモデルに対して進行状況インジケーターが表示され、必要な場合は個々のモデルを取り消すことができます。学習中に、モデルの結果およびプロットを確認したり、別の分類器に学習を開始させることができます。

並列学習を制御するには、アプリのツールストリップで [並列の使用] ボタンを切り替えます。[並列の使用] ボタンが使用可能になるのは、Parallel Computing Toolbox がインストールされている場合だけです。

Parallel Computing Toolbox がインストールされている場合、並列学習が分類学習器で使用可能になり、関数 statsetUseParallel オプションを設定する必要はありません。並列設定の [Automatically create a parallel pool] を無効にした場合、プールの起動前に確認メッセージが表示されます。

分類モデルの比較と改善

  1. [履歴] の一覧でモデルをクリックして、結果をプロットで確認します。散布図と混同行列で結果を検査して、モデルの性能を比較します。各モデルについて [履歴] の一覧に表示される精度のパーセンテージを確認します。分類学習器における分類器の性能評価を参照してください。

  2. [履歴] の一覧から最適なモデルを選択してから、モデルにさまざまな特徴量を含めたり、除外するかどうかを試行します。[特徴選択] をクリックします。

    平行座標プロットは、削除する特徴量を識別するために役立ちます。予測力が低い特徴量を削除するとモデルを改善できるかどうか調べます。モデルに含める予測子を指定し、新しいオプションを使用して新しいモデルを学習させます。[履歴] の一覧で各モデルの結果を比較します。

    PCA で特徴量を変換して次元を削減することもできます。

    分類学習器アプリの使用による特徴選択と特徴変換を参照してください。

  3. さらにモデルを改善するには、[詳細設定] ダイアログ ボックスで分類器のパラメーター設定を変更してから、新しいオプションを使用して学習させることができます。モデルの柔軟性を制御する方法についての詳細は、分類器のオプションの選択を参照してください。

  4. 特徴選択、PCA または新しいパラメーター設定によりモデルが改善される場合は、新しい設定で [すべて] のモデル タイプの学習を試します。別のモデル タイプで新しい設定を使用すると良好な結果が得られるかどうかを調べます。

ヒント

過適合を回避するには、十分な精度が得られる柔軟性が低いモデルを探してください。たとえば、高速で解釈が容易な決定木や判別分析などの単純なモデルを探します。応答を予測するにはモデルの精度が不十分である場合は、柔軟性が高い他の分類器 (アンサンブルなど) を選択します。モデルの柔軟性の詳細については、分類器のオプションの選択を参照してください。

次の図には、アプリと、さまざまなタイプの分類器が含まれている [履歴] の一覧が示されています。

ヒント

異なる分類器を比較する詳しい手順の例については、分類学習器アプリを使用した決定木の学習を参照してください。

以後の手順では、異なるデータでモデルに学習をさせるコードを生成するか、新しいデータを使用して予測を行うために学習済みモデルをワークスペースにエクスポートします。新しいデータを予測するための分類モデルのエクスポートを参照してください。

関連するトピック