Community Profile

photo

Y. M


Last seen: 約3年 前 2020 年からアクティブ

Followers: 0   Following: 0

統計

  • Thankful Level 3

バッジを表示

Feeds

表示方法

質問


強化学習の行動選択について
強化学習より得られた行動がどういうものだったのか、 状態sと照らし合わせて分析したいのですが、 学習が終了した後に確認することは可能でしょうか。 また、どういう行動が選ばれたのか出力することは可能でしょうか。

3年以上 前 | 0 件の回答 | 0

0

回答

質問


強化学習の報酬等をファイルに出力
強化学習を行う中、 1エピソード毎に報酬やステップ数といったデータを ファイルに出力したいのですが可能でしょうか。 trainingOptions = rlTrainingOptions(... 'MaxEpisodes',500,... ...

3年以上 前 | 0 件の回答 | 0

0

回答

質問


強化学習におけるrlTrainingOptionsについての質問
現在DQNを構築し、 他のソフトを環境として強化学習を実行しています。 環境側で1エピソード分の作業が終了した後、 次のエピソードが始まるまでに15秒ほど時間がかかるのですが、 その間にmatlab側では100エピソードほど進んでしまいます。 そ...

3年以上 前 | 0 件の回答 | 0

0

回答

質問


ファイル名の一部を変更
現在実行中のコードにてループ毎に、 file1,file2...とファイルの生成が行われています。 (ループカウント1:file1.txt、ループカウント2:file2.txt...という感じです) ここで、ループカウント2のときはfile1を、...

3年以上 前 | 1 件の回答 | 0

1

回答

質問


強化学習で環境を別ソフトに置き換えた場合にエピソード数がずれる問題
現在環境を別ソフトとしてMATLABと連成させて学習をさせようとしているのですが、 環境側が1エピソード進んだ後、MATLABのエージェント側を起動させようとすると、 MATLABが全エピソード分勧めようとしてしまい、エラーが発生してしまいます。 理...

3年以上 前 | 1 件の回答 | 0

1

回答

質問


強化学習におけるエピソード数の変数としての取得方法
強化学習用のコードを書いている途中で、 ε-greedy法の設定を以下のようにしたいと考えています。 if episode<400 agentOptions.EpsilonGreedyExploration=(episode*(-0.0012...

3年以上 前 | 1 件の回答 | 0

1

回答

質問


離散行動を複数持つQ関数の作成
rlFiniteSetSpec を使い、複数の離散行動を持つQ関数を作成したいのですが、 InputとDimensionの数が合わずエラーが返されてしまいます。 現在コードは下記のようにしているのですが、 DimensionをInputの数に合わせる...

3年以上 前 | 1 件の回答 | 0

1

回答

質問


エラー 関数または変数'featureInputLayer'が認識されません。
Rainforcement Learning ToolboxとDeep Learnig Toolboxを先日インストールし、 DQNエージェントを作成しようとしたところ、 ”関数または変数'featureInputLayer'が認識されません。” と...

3年以上 前 | 1 件の回答 | 0

1

回答

質問


テキストファイルから特定の行、列の読み込み
テキストファイルから特定のデータ(x行,y列目)のデータの取り出しを行いたいときはどのようにすればよろしいでしょうか。

3年以上 前 | 1 件の回答 | 0

1

回答