Main Content

環境

強化学習環境のダイナミクスと出力をモデル化する

強化学習のシナリオでは、エージェントがやり取りをする世界を環境によってモデル化します。

Reinforcement Learning Toolbox™ は、さまざまなベンチマーク環境を実装する事前定義済みオブジェクトを提供します。環境ダイナミクスのカスタム関数を使用したり、既存の環境テンプレート クラスを変更したり、Simulink® モデルを使用したりして、独自の環境を作成することもできます。

強化学習環境の概要については、Reinforcement Learning Environmentsを参照してください。

関数

すべて展開する

rlFiniteSetSpec有限集合アクションまたは観測チャネルのための仕様オブジェクトの作成
rlNumericSpec数値アクションまたは観測チャネルのための仕様オブジェクトの作成
getActionInfoObtain action data specifications from reinforcement learning environment, agent, or experience buffer
getObservationInfoObtain observation data specifications from reinforcement learning environment, agent, or experience buffer
validateEnvironmentValidate custom reinforcement learning environment
bus2RLSpecCreate reinforcement learning data specifications for elements of a Simulink bus
createGridWorld強化学習用の 2 次元グリッド ワールドの作成
createMDPマルコフ決定過程モデルの作成
rlMDPEnv強化学習のためのマルコフ決定過程環境の作成
rlPredefinedEnv事前定義済みの強化学習環境の作成
generateRewardFunctionGenerate a reward function from control specifications to train a reinforcement learning agent (R2021b 以降)
exteriorPenaltyExterior penalty value for a point with respect to a bounded region (R2021b 以降)
hyperbolicPenaltyHyperbolic penalty value for a point with respect to a bounded region (R2021b 以降)
barrierPenaltyLogarithmic barrier penalty value for a point with respect to a bounded region (R2021b 以降)
rlFunctionEnvリセット関数とステップ関数を使用したカスタム強化学習環境の作成
rlMultiAgentFunctionEnvCreate custom multiagent reinforcement learning environment (R2023b 以降)
rlTurnBasedFunctionEnvCreate custom turn-based multiagent reinforcement learning environment (R2023b 以降)
rlCreateEnvTemplateカスタム強化学習環境テンプレートの作成
rlSimulinkEnv既にエージェントと環境を含む Simulink モデルからの環境オブジェクトの作成
createIntegratedEnvCreate environment object from a Simulink environment model that does not contain an agent block
SimulinkEnvWithAgentReinforcement learning environment with a dynamic model implemented in Simulink
bus2RLSpecCreate reinforcement learning data specifications for elements of a Simulink bus
validateEnvironmentValidate custom reinforcement learning environment
rlNeuralNetworkEnvironmentEnvironment model with deep neural network transition models (R2022a 以降)
rlContinuousDeterministicTransitionFunctionDeterministic transition function approximator object for neural network-based environment (R2022a 以降)
rlContinuousGaussianTransitionFunctionStochastic Gaussian transition function approximator object for neural network-based environment (R2022a 以降)
rlContinuousDeterministicRewardFunctionDeterministic reward function approximator object for neural network-based environment (R2022a 以降)
rlContinuousGaussianRewardFunctionStochastic Gaussian reward function approximator object for neural network-based environment (R2022a 以降)
rlIsDoneFunctionIs-done function approximator object for neural network-based environment (R2022a 以降)
predictPredict next observation, next reward, or episode termination given observation and action input data (R2022a 以降)
evaluateEvaluate function approximator object given observation (or observation-action) input data (R2022a 以降)
accelerate (Not recommended) Option to accelerate computation of gradient for approximator object based on neural network (R2022a 以降)
resetReset environment, agent, experience buffer, or policy object (R2022a 以降)
setupSet up reinforcement learning environment or initialize data logger object (R2022a 以降)
cleanupClean up reinforcement learning environment or data logger object (R2022a 以降)

ブロック

RL Agent強化学習エージェント

トピック

強化学習環境の概要

グリッド ワールド環境

事前定義済み制御システム環境

カスタム MATLAB 環境

カスタム Simulink 環境

強化学習デザイナーでの環境の読み込み