強化学習とモデル予測制御を用いた実用的な自律制御アルゴリズムの設計
本動画シリーズでは、強化学習とモデル予測制御を協調して制御を行う設計方法について紹介します。 自律制御システムの「認知」「判断」「制御」という枠組みの重要性について説明し、強化学習を「判断」にのみ用いることで、強化学習の強みを活かしつつデメリットを解消する方法について説明します。 次に、理想的な環境モデルを用いて強化学習のエージェントを設計します。その後、詳細なプラントモデルを用いてモデル予測制御を設計し、強化学習とモデル予測制御を繋げて制御します。 強化学習の方策をコード生成し、マイコンを用いてPIL検証します。
自律制御システムは、大規模で複雑なシステムです。そのようなシステムを設計する場合に重要な概念や設計手法について解説します。
本動画シリーズでは、歩行者を回避しながら経路に沿って走行する制御システムを、強化学習とモデル予測制御を用いて設計します。
プラントモデルと制御システムをSimulinkで効率的にモデル化
本動画シリーズで紹介しているデモモデルは、全体のシステムをSimulinkで設計しています。その設計方法について解説します。
環境の情報から走行経路軌道を出力する強化学習エージェントを設計します。
非線形モデル予測制御を用いて、指令値軌道に遅れなく追従できる制御器を設計し、強化学習の方策と結合して問題なく実行できることを確認します。