MATLAB と Simulink による強化学習
スケジュールを確認して登録するコースの詳細
この1日コースでは、Reinforcement Learning Toolbox™に焦点を当て、MATLAB® および Simulink® 環境での 強化学習の基礎について学びます。
- 環境と報酬
- 方策とエージェント
- ニューラル ネットワークと学習
- 配布
1 日目
環境と報酬
目的: Simulink または MATLAB で環境と報酬を設定します。
- Simulink の強化学習ブロック
- 観測変数と行動変数
- MATLAB の環境とエージェント
- エージェントのシミュレーション
方策とエージェント
目的: 方策表現を作成し、エージェントを作成します。
- MATLAB のエージェント タイプ
- 方策表
ニューラル ネットワークと学習
目的: 方策表現に対してニューラルネットワークを構成し、エージェントを学習させます。
- ニューラル ネットワークの層
- ディープ ネットワーク デザイナー
- 表現オプションと学習オプション
- 学習
- 強化学習デザイナー アプリ
配布
目的: 訓練済みのエージェントからコードを生成します。
- 方策をコードとしてコンパイルする
- コードを検証する