createMDP
マルコフ決定過程オブジェクトの作成
説明
マルコフ決定過程 (MDP) は、状態と観測値が有限空間に属し、確率的ルールが状態遷移を制御する離散時間の確率的制御プロセスです。MDP は、強化学習を使用して解決された最適化問題を研究するのに役立ちます。createMDP 関数を使用して、指定された状態と遷移をもつ GenericMDP オブジェクトを作成します。その後、オブジェクトのプロパティの一部を変更し、それを rlMDPEnv に渡して、エージェントが対話できる環境を作成できます。
例
入力引数
出力引数
バージョン履歴
R2019a で導入