強化学習におけるエピソード数の変数としての取得方法

Question

Y. M 2020 年 10 月 20 日

0
リンク

この質問への直接リンク

https://jp.mathworks.com/matlabcentral/answers/619903-

コメント済み: Y. M 2020 年 10 月 21 日

強化学習用のコードを書いている途中で、

ε-greedy法の設定を以下のようにしたいと考えています。

if episode<400
    agentOptions.EpsilonGreedyExploration=(episode*(-0.00125)+0.5+0.05)
end

↑は、εを0.5から0.05へ、一次関数的に減衰させることを目的としたコードです。

ここで、エピソード数を変数として取得するにはどのようにすればよろしいでしょうか。

初歩的な質問で大変恐縮ですが、

教えていただけますと幸いです。

0 件のコメント
-2 件の古いコメントを表示-2 件の古いコメントを非表示

サインインしてコメントする。

サインインしてこの質問に回答する。

Answer 1

Hiro Yoshino 2020 年 10 月 20 日

0
リンク

この回答への直接リンク

https://jp.mathworks.com/matlabcentral/answers/619903-#answer_519238

train関数を使って学習させる場合は、episodeから都度変更することは出来ないと思われます。

agentOptions.EpsilonDecay % 減衰率
agentOptions.EpsilonMin % 最小のepsilon値

で非線形に小さくなっていきます。

3 件のコメント
1 件の古いコメントを表示1 件の古いコメントを非表示

Hiro Yoshino 2020 年 10 月 21 日

何のアルゴリズムを使うかで、agentのオプションは当然ことなります

Q-learningなら

https://jp.mathworks.com/help/reinforcement-learning/ref/rlqagentoptions.html

から調べてください。

インスタンスを作るタイミングでもepsilonは設定できますし、あとから設定することもできます。

Q-agentの場合は、

agentOptions.Epsilon = 0.1;

のように設定できます。

Y. M 2020 年 10 月 21 日

ありがとうございます。

頂いた助言をもとに何とかやってみたいと思います。

サインインしてコメントする。

強化学習におけるエピソード数の変数としての取得方法

0 件のコメント
-2 件の古いコメントを表示-2 件の古いコメントを非表示

採用された回答

3 件のコメント
1 件の古いコメントを表示1 件の古いコメントを非表示

その他の回答 (0 件)

参考

カテゴリ

タグ

Community Treasure Hunt

強化学習におけるエピ​ソード数の変数として​の取得方法

0 件のコメント -2 件の古いコメントを表示-2 件の古いコメントを非表示

採用された回答

3 件のコメント 1 件の古いコメントを表示1 件の古いコメントを非表示

その他の回答 (0 件)

参考

カテゴリ

タグ

Community Treasure Hunt

強化学習におけるエピソード数の変数としての取得方法

0 件のコメント
-2 件の古いコメントを表示-2 件の古いコメントを非表示

3 件のコメント
1 件の古いコメントを表示1 件の古いコメントを非表示