強化学習とモデル予測制御を用いた実用的な自律制御アルゴリズムの設計
本動画シリーズでは、強化学習とモデル予測制御を協調して制御を行う設計方法について紹介します。 自律制御システムの「認知」「判断」「制御」という枠組みの重要性について説明し、強化学習を「判断」にのみ用いることで、強化学習の強みを活かしつつデメリットを解消する方法について説明します。 次に、理想的な環境モデルを用いて強化学習のエージェントを設計します。その後、詳細なプラントモデルを用いてモデル予測制御を設計し、強化学習とモデル予測制御を繋げて制御します。 強化学習の方策をコード生成し、マイコンを用いてPIL検証します。