Reinforcement-learning-with-tensorflow
Reinforcement-learning-with-tensorflow copied to clipboard
关于PPO具体使用
您好,我正在使用simply_PPO训练我的机器人做步态行走训练,其中,S_DIM是18,A_DIM 是12,请问需要对simply_PPO做哪些改变才能更好地适应我的训练?