photo


Last seen: 1年以上 前 2024 年からアクティブ

Followers: 0   Following: 0

統計

MATLAB Answers

1 質問
0 回答

ランク
293,625
of 300,781

評判
0

コントリビューション
1 質問
0 回答

回答採用率
0.0%

獲得投票数
0

ランク
 of 21,088

評判
N/A

平均評価
0.00

コントリビューション
0 ファイル

ダウンロード
0

ALL TIME ダウンロード
0

ランク

of 171,031

コントリビューション
0 問題
0 解答

スコア
0

バッジ数
0

コントリビューション
0 投稿

コントリビューション
0 パブリック チャネル

平均評価

コントリビューション
0 ハイライト

平均いいねの数

Feeds

表示方法

質問


我再使用强化学习工具箱编写SAC智能体进行训练时策略一直在上下限波动,没有很好的探索,而使用DDPG智能体和PPO智能体则是能够进行一些有效的探索,请问这是什么原因?
%main % 观测空间和动作空间定义 % numObs = 11; %观测空间维度 % numAct = 4;%动作空间维度 numObs1 = 7; %观测空间维度 numAct1 = 3;%动作空间维度 %BS, EB, ,CL a...

1年以上 前 | 1 件の回答 | 0

1

回答