James Sorokhaibam
Followers: 0 Following: 0
統計
MATLAB Answers
1 質問
0 回答
ランク
of 154,207
コントリビューション
0 問題
0 解答
スコア
0
バッジ数
0
コントリビューション
0 投稿
コントリビューション
0 パブリック チャネル
平均評価
コントリビューション
0 ハイライト
平均いいねの数
Feeds
質問
High fluctuation in Q0 value for TD3 agent while training.
I am training a TD3 RL agent for pick and place robot. The reward function is, reward = exp(-E/d) where E is the total energy co...
7ヶ月 前 | 1 件の回答 | 0