RL Agent
強化学習エージェント
ライブラリ:
Reinforcement Learning Toolbox
説明
RL Agent ブロックを使用して、Simulink® で強化学習エージェントのシミュレーションと学習を行います。MATLAB® ワークスペースに保存されているエージェント、または rlACAgent
オブジェクトや rlDDPGAgent
オブジェクトなどのデータ ディクショナリにブロックを関連付けます。ブロックを接続して、観測値と計算された報酬を受け取るようにします。たとえば、次の rlSimplePendulumModel
モデルのブロック線図について考えます。
RL Agent ブロックの [observation] 入力端子は、振子の瞬間的な角度と角速度から派生した信号を受け取ります。[reward] 端子は、同じ 2 つの値と適用されたアクションから計算された報酬を受け取ります。システムに適した観測値と報酬の計算を構成します。
ブロックはエージェントを使用し、提供された観測値と報酬に基づいてアクションを生成します。[action] 出力端子をシステムの適切な入力に接続します。たとえば、rlSimplePendulumModel
の [action] 出力端子は、振子システムに適用されるトルクです。このモデルの詳細については、振子の振り上げと平衡化のための DQN エージェントの学習を参照してください。
Simulink で強化学習エージェントに学習させるには、Simulink モデルから環境を生成します。次に、その環境に対して学習させるエージェントを作成して構成します。詳細については、Create Custom Simulink Environmentsを参照してください。環境を使用して train
を呼び出すと、train
はモデルをシミュレーションし、ブロックに関連付けられたエージェントを更新します。
例
端子
入力
出力
パラメーター
バージョン履歴
R2019a で導入