Y. M

Last seen: 約4年前 | 2020 年からアクティブ

Followers: 0 Following: 0

統計

バッジを表示

Feeds

質問

強化学習の行動選択について
強化学習より得られた行動がどういうものだったのか、状態sと照らし合わせて分析したいのですが、学習が終了した後に確認することは可能でしょうか。また、どういう行動が選ばれたのか出力することは可能でしょうか。

約4年前 | 0 件の回答 | 0

0

回答

質問

強化学習の報酬等をファイルに出力
強化学習を行う中、 1エピソード毎に報酬やステップ数といったデータをファイルに出力したいのですが可能でしょうか。 trainingOptions = rlTrainingOptions(... 'MaxEpisodes',500,... ...

約4年前 | 0 件の回答 | 0

0

回答

質問

強化学習におけるrlTrainingOptionsについての質問
現在DQNを構築し、他のソフトを環境として強化学習を実行しています。環境側で1エピソード分の作業が終了した後、次のエピソードが始まるまでに15秒ほど時間がかかるのですが、その間にmatlab側では100エピソードほど進んでしまいます。そ...

約4年前 | 0 件の回答 | 0

0

回答

質問

ファイル名の一部を変更
現在実行中のコードにてループ毎に、 file1,file2...とファイルの生成が行われています。（ループカウント1：file1.txt、ループカウント２：file2.txt...という感じです）ここで、ループカウント２のときはfile1を、...

約4年前 | 1 件の回答 | 0

1

回答

質問

強化学習で環境を別ソフトに置き換えた場合にエピソード数がずれる問題
現在環境を別ソフトとしてMATLABと連成させて学習をさせようとしているのですが、環境側が1エピソード進んだ後、MATLABのエージェント側を起動させようとすると、 MATLABが全エピソード分勧めようとしてしまい、エラーが発生してしまいます。理...

4年以上前 | 1 件の回答 | 0

1

回答

質問

強化学習におけるエピソード数の変数としての取得方法
強化学習用のコードを書いている途中で、 ε-greedy法の設定を以下のようにしたいと考えています。 if episode<400 agentOptions.EpsilonGreedyExploration=(episode*(-0.0012...

4年以上前 | 1 件の回答 | 0

1

回答

質問

離散行動を複数持つQ関数の作成
rlFiniteSetSpec を使い、複数の離散行動を持つQ関数を作成したいのですが、 InputとDimensionの数が合わずエラーが返されてしまいます。現在コードは下記のようにしているのですが、 DimensionをInputの数に合わせる...

4年以上前 | 1 件の回答 | 0

1

回答

質問

エラー　関数または変数'featureInputLayer'が認識されません。
Rainforcement Learning ToolboxとDeep Learnig Toolboxを先日インストールし、 DQNエージェントを作成しようとしたところ、 ”関数または変数'featureInputLayer'が認識されません。” と...

4年以上前 | 1 件の回答 | 0

1

回答

質問

テキストファイルから特定の行、列の読み込み
テキストファイルから特定のデータ（x行,y列目）のデータの取り出しを行いたいときはどのようにすればよろしいでしょうか。

4年以上前 | 1 件の回答 | 0

1

回答

Y. M

統計

Thankful Level 3

MATLAB Answers

Feeds

0

0

0

1

1

1

1

1

1