強化学習

不明な動的環境とのやり取りによる深層ニューラルネットワークエージェントの学習

強化学習は目標指向型の計算手法で、エージェントが不明な動的環境とやり取りすることによってタスクの実行を学習します。学習が実行されている間、学習アルゴリズムがエージェントの方策パラメーターを更新します。学習アルゴリズムの目標は、タスク実行中に受け取る長期的な報酬が最大になる最適な方策を見つけることです。

方策は、エージェントのタイプに応じて 1 つ以上の方策関数と価値関数で表されます。深層ニューラルネットワークを使用して、これらの表現を実装することができます。その後、Reinforcement Learning Toolbox™ ソフトウェアを使用してこれらのネットワークに学習させることができます。

詳細については、深層ニューラルネットワークを使用した強化学習を参照してください。

トピック

深層ニューラルネットワークを使用した強化学習
強化学習は目標指向型の計算手法で、コンピューターが不明な動的環境とやり取りすることによってタスクの実行を学習します。
Simulink 環境の作成とエージェントの学習
Simulink^® で学習環境としてモデル化されたプラントを使用し、強化学習を使ってコントローラーに学習させる。
ディープネットワークデザイナーを使用した DQN エージェントの作成およびイメージ観測値を使用した学習
Deep Learning Toolbox™ のディープネットワークデザイナーアプリを使用して、強化学習エージェントを作成する。
振子の振り上げと平衡化のための、イメージ観測を使用した DDPG エージェントの学習
イメージベースの観測信号を使用して、強化学習エージェントに学習させる。
並列計算を使用した車線維持支援用 DQN エージェントの学習
車線維持支援アプリケーション用に、強化学習エージェントに学習させる。
Imitate MPC Controller for Lane Keeping Assist
Train a deep neural network to imitate the behavior of a model predictive controller.