メインコンテンツ

強化学習

不明な動的環境とのやり取りによる深層ニューラル ネットワーク エージェントの学習

強化学習は目標指向型の計算学習手法で、エージェントが不明な動的環境とやり取りすることによってタスクの実行を学習します。学習が実行されている間、学習アルゴリズムがエージェントの方策パラメーターを更新します。学習アルゴリズムの目標は、タスク実行中に受け取る累積割引長期報酬の期待値が最大になる最適な方策を見つけることです。

この学習手法により、エージェントは人間の介入なしに、また目標を達成するために明示的にプログラムされることなく、タスクの累積報酬を最大化するような一連の決定を下すことができるようになります。Reinforcement Learning Toolbox™ ソフトウェアを使用して、強化学習エージェントを作成して学習させることができます。

詳細については、強化学習とは (Reinforcement Learning Toolbox)を参照してください。

トピック

注目の例