教師あり学習

機械学習の手法を使用して既知の入力および応答データから予測モデルを構築する

教師あり学習 (Supervised Learning) とは、最も一般的なタイプの 機械学習 アルゴリズムです。既知のデータセット (学習用データセットと呼ばれます) を使用し、既知の入力 (特徴量と呼ばれます) と既知の応答によってアルゴリズムを学習させて、予測を行います。学習用データセットには、望ましい出力または応答値を持つラベル付き入力データのペアが含まれています。教師あり学習アルゴリズムはこのデータセットを使って、特徴量と出力データの関係を検出してモデルを作成し、新しいデータセットに対する応答値を予測します。

教師あり学習を適用するに先立って、入力データの中から特徴候補を示すパターンを見つけるために教師なし学習がよく使用されます。また、特徴量エンジニアリングがそれらのパターンをより教師あり学習に適したものに変換します。特徴の特定に加えて、学習用データセットのすべての観測値に対して正しいカテゴリまたは応答を特定しなければなりません。しかし、この手順には大きな労力が必要です。半教師あり学習では、非常に限られたラベル付きデータでモデルの学習を行うことができるため、ラベル付けの労力が軽減されます。

アルゴリズムの学習が終わると、学習に使用されていないテスト用データセットは、通常、アルゴリズムの性能を予測し、その妥当性を確認するために使用されます。正確な性能の結果を取得するためには、学習用およびテスト用データセットの両方が「現実」を適切に表現していることが重要です (運用環境のデータとモデルの両方が正しく検証されていることを意味します)。

モデル検証に関する質問と回答

Deep Learning Toolbox™ および Statistics and Machine Learning Toolbox™ とともに MATLAB® を使用して、教師あり学習の予測モデルの学習、妥当性確認、および調整を行うことができます。

教師あり学習アルゴリズムのカテゴリ

分類: カテゴリカル応答値に使用し、データを特定のクラスに分けられるようにします。バイナリ分類モデルには 2 つのクラスがあり、マルチクラス分類モデルにはそれより多い数のクラスがあります。いずれの場合も、MATLAB で分類学習器アプリを使用して、分類モデルの学習を行うことができます。

一般的な分類アルゴリズムには、次のものがあります。

回帰: 数値的な連続応答値に対して使用します。MATLAB で回帰学習器アプリを使用して、回帰モデルの学習を行うことができます

一般的な回帰アルゴリズムには、次のようなものがあります。

教師あり学習の適用

教師あり学習は、 信用格付け、アルゴリズム取引、債券の分類などの金融分野、オブジェクト分類や追跡などの画像・映像分野、外れ値検出などの産業分野、機器の残存耐用期間予測などの予知保全分野、腫瘍の検出や創薬などの生命科学分野、価格や需要の予測などのエネルギー分野で用いられています。

参考: Statistics and Machine Learning Toolbox, Deep Learning Toolbox, 機械学習, 教師なし学習, AdaBoost, 線形回帰, 非線形回帰, データのフィッティング, データ解析, 数学モデリング, 予測モデリング, AI (人工知能), AutoML, 正則化