メインコンテンツ

rlPredefinedEnv

事前定義済みの強化学習環境の作成

説明

env = rlPredefinedEnv(keyword) は、MATLAB® または Simulink® の強化学習環境 env を作成するための環境名を表す事前定義済みのキーワード keyword を受け取ります。環境 env は、エージェントがやり取りをするダイナミクスをモデル化し、エージェントのアクションに応じて報酬と観測値を生成します。

すべて折りたたむ

事前定義済みのキーワード "BasicGridWorld" を使用して、基本グリッド ワールドの強化学習環境を作成します。

env = rlPredefinedEnv("BasicGridWorld")
env = 
  rlMDPEnv with properties:

       Model: [1×1 rl.env.GridWorld]
    ResetFcn: []

事前定義済みのキーワード "DoubleIntegrator-Continuous" を使用して、連続型 2 重積分器の強化学習環境を作成します。

env = rlPredefinedEnv("DoubleIntegrator-Continuous")
env = 
  DoubleIntegratorContinuousAction with properties:

             Gain: 1
               Ts: 0.1000
      MaxDistance: 5
    GoalThreshold: 0.0100
                Q: [2×2 double]
                R: 0.0100
         MaxForce: Inf
            State: [2×1 double]

関数 plot を使用して環境を可視化し、関数 reset と関数 step を使用して環境とやり取りできます。

plot(env)
observation = reset(env)
observation = 2×1

     4
     0

[observation,reward,isDone] = step(env,16)

Figure Double Integrator Visualizer contains an axes object. The axes object contains an object of type rectangle.

observation = 2×1

    4.0800
    1.6000

reward = 
-16.5559
isDone = logical
   0

事前定義済みのキーワード "SimplePendulumModel-Continuous" を使用して、連続型単純振子モデルの強化学習環境を作成します。

env = rlPredefinedEnv("SimplePendulumModel-Continuous")
env = 
SimulinkEnvWithAgent with properties:

           Model : rlSimplePendulumModel
      AgentBlock : rlSimplePendulumModel/RL Agent
        ResetFcn : []
  UseFastRestart : on

入力引数

すべて折りたたむ

環境名を表す事前定義済みのキーワード。次のいずれかとして指定します。

MATLAB 環境

  • "BasicGridWorld"

  • "CartPole-Discrete"

  • "CartPole-Continuous"

  • "DoubleIntegrator-Discrete"

  • "DoubleIntegrator-Continuous"

  • "SimplePendulumWithImage-Discrete"

  • "SimplePendulumWithImage-Continuous"

  • "WaterFallGridWorld-Stochastic"

  • "WaterFallGridWorld-Deterministic"

Simulink 環境

  • "SimplePendulumModel-Discrete"

  • "SimplePendulumModel-Continuous"

  • "CartPoleSimscapeModel-Discrete"

  • "CartPoleSimscapeModel-Continuous"

出力引数

すべて折りたたむ

MATLAB または Simulink の環境オブジェクト。次のいずれかとして返されます。

  • rlMDPEnv オブジェクト (次のキーワードのいずれかを使用する場合)。

    • "BasicGridWorld"

    • "WaterFallGridWorld-Stochastic"

    • "WaterFallGridWorld-Deterministic"

  • CartPoleDiscreteAction オブジェクト ("CartPole-Discrete" キーワードを使用する場合)。

  • CartPoleContinuousAction オブジェクト ("CartPole-Continuous" キーワードを使用する場合)。

  • DoubleIntegratorDiscreteAction オブジェクト ("DoubleIntegrator-Discrete" キーワードを使用する場合)。

  • DoubleIntegratorContinuousAction オブジェクト ("DoubleIntegrator-Continuous" キーワードを使用する場合)。

  • SimplePendlumWithImageDiscreteAction オブジェクト ("SimplePendulumWithImage-Discrete" キーワードを使用する場合)。

  • SimplePendlumWithImageContinuousAction オブジェクト ("SimplePendulumWithImage-Continuous" キーワードを使用する場合)。

  • SimulinkEnvWithAgent オブジェクト (次のキーワードのいずれかを使用する場合)。

    • "SimplePendulumModel-Discrete"

    • "SimplePendulumModel-Continuous"

    • "CartPoleSimscapeModel-Discrete"

    • "CartPoleSimscapeModel-Continuous"

バージョン履歴

R2019a で導入