最近のニュースで、強化学習のアルゴリズムがどのようにして囲碁、Dota 2、Starcraft 2 などのゲームでプロを破ったかが取り上げられました。強化学習は、機械学習の一種であり、ビデオゲームからロボット工学、自動運転車のような複雑な用途における人工知能の使用を可能にします。

プロジェクトで強化学習の技術を活用することに興味があっても、これまで一度も使ったことがないとしたら、何から始めたらいいでしょうか。

この ebook は、MATLAB® および Simulink® で強化学習を始められるように、用語を解説し、例やチュートリアル、評価版ソフトウェアをご紹介します

ebook をダウンロードすると、以下の内容を学習することができます。

セクション 1: 基礎と環境の設定

強化学習の基礎と、従来の制御設計との類似点や相違点を学びます。教師あり学習、教師なし学習、強化学習の間の相違点、および MATLAB と Simulink を使用した学習環境の設定方法を確認します。

セクション 2: 報酬と方策の構造

強化学習における探索と活用、および報酬関数の形成方法について学びます。ニューラルネットワークなどの方策を表現するためのさまざまな方法と、それらを関数近似して使用する方法を確認しましょう。

セクション 3: 学習の理解と展開

方策ベース、価値ベース、およびactor-critic法を含む、さまざまなタイプの学習アルゴリズムについて学びます。各学習手法の長所と短所、および有名なベルマン方程式について詳しく確認します。最後に、学習済み方策を展開する前に考慮すべきこと、およびこの手法に関連する全体的な課題と欠点を確認します。