ElegantRL
ElegantRL copied to clipboard
train_ppo_a2c_for_lunar_lander_continuous的ppo算法,好像不能完全复现曲线变化情况
train_ppo_a2c_for_lunar_lander_continuous的ppo算法,好像不能完全复现曲线变化情况。 如果想完全复现曲线情况,不知道需不需要env.seed(args.random_seed)呢? 但是我尝试加了下env.seed(args.random_seed),好像起的作用不是很多大。 曲线不能完全浮现,不知道是不是因为多线程原因呢?还是别的原因呢?