第 4 章

教師あり学習の適用


どんな時に教師あり学習を検討するべきか

教師あり学習アルゴリズムは、既知の入力データセット (学習用データセット) と、そのデータに対する既知の応答 (出力) を利用してモデルの学習を行い、新たな入力データに対する応答としてモデルが合理的な予測を導き出せるようにします。予測しようとする事象について、既存の応答 (出力) データがある場合は、教師あり学習を使用します。

教師あり学習はすべて、分類または回帰の形態をとります。

ビデオの長さ 4:35

分類手法では、離散的な応答を予測します。たとえば、電子メールが本物のメールかスパムメールか、腫瘍の大きさが大・中・小のどれに当てはまるか、といった場合です。分類モデルの学習は、データをカテゴリに分類するために行われます。用途としては、医用画像処理、音声認識、信用スコアリングなどが挙げられます。

回帰手法では、連続的な応答を予測します。たとえば、温度変化や電力需要の変動などを予測する場合に使用します。用途としては、株価予測、手書き文字認識、音響信号処理などが挙げられます。

適切なアルゴリズムの選択

第 1 章でご覧いただいたように、機械学習アルゴリズムの選択は試行錯誤のプロセスです。また、それぞれのアルゴリズムが持つ以下のような特徴の間でトレードオフを探る過程でもあります。

  • 学習速度
  • メモリ使用量
  • 新しいデータに対する予測精度
  • 透明性または解釈可能性 (アルゴリズムが予測を行う理由をどれだけ簡単に理解できるか)

一般的な分類アルゴリズム

一般的な回帰アルゴリズム