このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
分類学習器アプリを使用したバイナリ GLM ロジスティック回帰分類器の学習
この例では、2 つのクラスを含む ionosphere
データ セットを使用して分類学習器アプリでバイナリ GLM ロジスティック回帰分類器に学習させる方法を示します。ionosphere
のデータでは、良好なレーダー反射を表す g
、不良なレーダー反射を表す b
という 2 つのレベルがあるカテゴリカル変数が応答変数です。
MATLAB® で
ionosphere
データセットを読み込み、このデータセットに含まれている変数の一部を分類に使用するように定義します。load ionosphere ionosphere = array2table(X); ionosphere.Group = Y;
あるいは、
ionosphere
のデータセットを読み込み、X
とY
のデータを個別の変数として保持することができます。[アプリ] タブの [機械学習および深層学習] グループで [分類学習器] をクリックします。
[学習] タブの [ファイル] セクションで、[新規セッション]、[ワークスペースから] をクリックします。
[ワークスペースからの新規セッション] ダイアログ ボックスで、[データセット変数] のリストから table
ionosphere
を選択します。アプリによってGroup
が応答変数として、残りが予測子として選択されていることを確認します。Group
には 2 つのレベルがあります。あるいは、予測子データ
X
と応答変数Y
を 2 つの個別の変数として保持している場合は、最初に [データセット変数] のリストから行列X
を選択できます。その後、[応答] の [ワークスペースから] オプション ボタンをクリックし、リストからY
を選択します。Y
変数は、Group
変数と同じです。[セッションの開始] をクリックします。
データの散布図が作成されます。
散布図を使用して、どの変数が応答の予測に有用であるかを可視化します。X 軸と Y 軸の制御で他の変数を選択します。クラスが最も明確に分離されるのはどの変数であるかを調べます。
バイナリ GLM ロジスティック回帰分類器に学習させます。[学習] タブの [モデル] セクションで [さらに表示] 矢印をクリックして分類器のギャラリーを表示します。[ロジスティック回帰分類器] で [バイナリ GLM ロジスティック回帰] をクリックします。次に、[学習] セクションで、[すべてを学習] をクリックして [すべてを学習] を選択します。
メモ
Parallel Computing Toolbox™ がある場合は、[並列の使用] ボタンが既定でオンになります。[すべてを学習] をクリックして [すべてを学習] または [選択を学習] を選択すると、ワーカーの並列プールが開きます。この間、ソフトウェアの対話的な操作はできません。プールが開いた後、モデルの学習を並列で実行しながらアプリの操作を続けることができます。
Parallel Computing Toolbox がない場合は、[すべてを学習] メニューの [バックグラウンド学習を使用] チェック ボックスが既定でオンになります。オプションを選択してモデルに学習させると、バックグラウンド プールが開きます。プールが開いた後、モデルの学習をバックグラウンドで実行しながらアプリの操作を続けることができます。
分類学習器で、モデルと既定の複雑な木のモデルの学習が行われます。最適なモデルの [精度 (検証)] スコアの概要がボックスに表示されます。また、ロジスティック回帰モデルの検証の混同行列も表示されます。
メモ
検証により、結果に無作為性が導入されます。実際のモデルの検証結果は、この例に示されている結果と異なる場合があります。
モデルの結果を確認するには、[概要] タブを調べます。このタブを開くには、[モデル] ペインの右上にある [選択したモデルの概要を開く] ボタンをクリックします。モデルの [概要] タブには、検証セットに対して計算された [学習結果] のメトリクスが表示されます。
学習済みモデルの散布図を確認します。[学習] タブの [プロットと結果] セクションで矢印をクリックしてギャラリーを開き、[検証結果] グループの [散布] をクリックします。別の予測子のプロットを試します。誤分類された点は X で示されます。
各クラスにおける予測子の精度を調べます。[学習] タブの [プロットと結果] セクションで矢印をクリックしてギャラリーを開き、[検証結果] グループの [混同行列 (検証)] をクリックします。真のクラスと予測したクラスの結果が含まれている行列が表示されます。
[モデル] ペインで最適なモデルを選択します (最高のスコアがボックスで強調表示されます)。モデルを改善するため、異なる特徴量をモデルに含めます。予測力が低い特徴量を削除するとモデルを改善できるかどうか調べます。
最初に最適なモデルを複製します。モデルを右クリックして [複製] を選択します。
次のいずれかの方法で、追加または除外する特徴量を調べます。
平行座標プロットを使用します。[学習] タブの [プロットと結果] セクションで矢印をクリックしてギャラリーを開き、[検証結果] グループの [平行座標] をクリックします。クラスを十分に分離する予測子を保持します。
モデルの [概要] タブで、学習時に使用する予測子を指定できます。[特徴選択] をクリックしてセクションを展開し、モデルから削除する予測子を指定します。
特徴ランク付けアルゴリズムを使用します。[学習] タブの [オプション] セクションで [特徴選択] をクリックします。[既定の特徴選択] タブで、使用する特徴ランク付けアルゴリズムと、最も高ランクの特徴からいくつの特徴を保持するかを指定します。使用する特徴の数は棒グラフで判断できます。
[保存して適用] をクリックして変更を保存します。新しい特徴選択は [モデル] ペインの既存のドラフト モデルに適用されるほか、[学習] タブの [モデル] セクションのギャラリーを使用して作成する新しいドラフト モデルに適用されます。
モデルに学習させます。[学習] タブの [学習] セクションで、[すべてを学習] をクリックして [選択を学習] を選択し、新しいオプションを使用してモデルに学習させます。[モデル] ペインで各分類器の結果を比較します。
学習済みのモデルの完全なバージョンをワークスペースにエクスポートできます。[学習] タブで、[エクスポート] をクリックして [モデルのエクスポート] をクリックし、[モデルのエクスポート] を選択します。バイナリ GLM ロジスティック回帰モデルには常に学習データが格納されるため、[分類モデルのエクスポート] ダイアログ ボックスで、学習データを含めるチェック ボックスは選択された状態で無効になっています。ダイアログ ボックスで [OK] をクリックすると、既定の変数名がそのまま使用されます。
この分類器に学習をさせるためのコードを確認するため、[関数の生成] をクリックします。
このワークフローを使用すると、分類学習器で学習させることができる他のタイプの分類器を評価および比較できます。
選択したデータセットに対して使用できる事前設定済みの最適化不可能な分類器モデルをすべて試すには、次のようにします。
[学習] タブの [モデル] セクションで矢印をクリックして分類モデルのギャラリーを開きます。
[開始] グループで [すべて] をクリックします。
[学習] セクションで、[すべてを学習] をクリックして [すべてを学習] を選択します。
他の分類器のタイプについては、分類学習器アプリにおける分類モデルの学習を参照してください。