rlSARSAAgent
SARSA 強化学習エージェント
説明
SARSA アルゴリズムは、離散行動空間をもつ環境向けの On-Policy 強化学習手法です。SARSA エージェントは、Q 値関数クリティックに学習させて、現在の ε-greedy 方策の値を推定します (最適な方策を直接学習しようとはしません)。
メモ
SARSA エージェントは再帰型ネットワークをサポートしません。
SARSA エージェントの詳細については、SARSA エージェントを参照してください。
さまざまな種類の強化学習エージェントの詳細については、強化学習エージェントを参照してください。
作成
説明
は、指定されたクリティック ネットワークを使用して SARSAエージェントを作成し、agent = rlSARSAAgent(critic,agentOptions)AgentOptions プロパティを設定します。
入力引数
プロパティ
オブジェクト関数
train | Train reinforcement learning agents within a specified environment |
sim | Simulate trained reinforcement learning agents within specified environment |
getAction | Obtain action from agent, actor, or policy object given environment observations |
getCritic | 強化学習エージェントからのクリティックの抽出 |
setCritic | Set critic of reinforcement learning agent |
generatePolicyFunction | Generate MATLAB function that evaluates policy of an agent or policy object |
例
バージョン履歴
R2019a で導入
参考
関数
getAction|getActor|getCritic|getModel|generatePolicyFunction|generatePolicyBlock|getActionInfo|getObservationInfo
オブジェクト
rlSARSAAgentOptions|rlVectorQValueFunction|rlQValueFunction|rlQAgent|rlLSPIAgent|rlDQNAgent