ElegantRL icon indicating copy to clipboard operation
ElegantRL copied to clipboard

train_ppo_a2c_for_lunar_lander_continuous的ppo算法,好像不能完全复现曲线变化情况

Open lindefoe opened this issue 1 year ago • 0 comments

QQ图片20231228105937

train_ppo_a2c_for_lunar_lander_continuous的ppo算法,好像不能完全复现曲线变化情况。 如果想完全复现曲线情况,不知道需不需要env.seed(args.random_seed)呢? 但是我尝试加了下env.seed(args.random_seed),好像起的作用不是很多大。 曲线不能完全浮现,不知道是不是因为多线程原因呢?还是别的原因呢?

lindefoe avatar Dec 28 '23 03:12 lindefoe