このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
Policy
ライブラリ:
Reinforcement Learning Toolbox
説明
Policy ブロックを使用して、Simulink® で強化学習方策をシミュレーションし、展開のためにコードを生成します (Simulink Coder™ を使用)。このブロックは観測値を入力として受け取り、アクションを出力します。方策を完全に特徴付けるために必要な情報が格納された MAT ファイルにこのブロックを関連付けます。また、このファイルは、generatePolicyFunction
または generatePolicyBlock
によって生成できます。
例
端子
入力
出力
パラメーター
ヒント
Embedded Coder® を使用して並列コードを生成する場合、[並列 for ループの生成] 最適化パラメーターを有効にすると、処理するデータのサイズが大きい場合のパフォーマンスが向上します。ただし、ネットワークやデータが小さい場合は、並列化のためのスレッド初期化のオーバーヘッドによってパフォーマンスが大幅に低下します。この場合、[並列 for ループの生成] を無効にしてください。詳細については、並列 for ループの生成 (Embedded Coder)および
coder.MexCodeConfig
(MATLAB Coder) を参照してください。
拡張機能
バージョン履歴
R2022b で導入
参考
関数
オブジェクト
rlMaxQPolicy
|rlEpsilonGreedyPolicy
|rlAdditiveNoisePolicy
|rlDeterministicActorPolicy
|rlStochasticActorPolicy