このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
rlQAgent
Q 学習の強化学習エージェント
説明
Q 学習アルゴリズムは、離散行動空間をもつ環境向けの Off-Policy 強化学習手法です。Q 学習エージェントは、Q 値関数クリティックに学習させて最適な方策の値を推定し、クリティックによって推定された値に基づいて ε-greedy 方策に従います。
メモ
Q 学習エージェントは再帰型ネットワークをサポートしません。
Q 学習エージェントの詳細については、Q 学習エージェントを参照してください。
さまざまな種類の強化学習エージェントの詳細については、強化学習エージェントを参照してください。
作成
説明
は、指定されたクリティック ネットワークを使用して Q 学習エージェントを作成し、agent
= rlQAgent(critic
,agentOptions
)AgentOptions
プロパティを設定します。
入力引数
プロパティ
オブジェクト関数
train | Train reinforcement learning agents within a specified environment |
sim | Simulate trained reinforcement learning agents within specified environment |
getAction | Obtain action from agent, actor, or policy object given environment observations |
getCritic | 強化学習エージェントからのクリティックの抽出 |
setCritic | Set critic of reinforcement learning agent |
generatePolicyFunction | Generate MATLAB function that evaluates policy of an agent or policy object |
例
バージョン履歴
R2019a で導入
参考
関数
getAction
|getActor
|getCritic
|getModel
|generatePolicyFunction
|generatePolicyBlock
|getActionInfo
|getObservationInfo