Reinforcement-learning-with-tensorflow
Reinforcement-learning-with-tensorflow copied to clipboard
Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学
我在服务器上跑REINFORCE的代码,我发现gpu的利用率差不多只有30%,而cpu的利用率没有拉满,只有不到80%,这是什么原因导致的啊,代码里面没有写日志的io操作。 这是REINFORCE本身的问题吗,还是其他原因导致的啊。 感谢!
请问 2d car的项目要怎么运行呢?
大家有遇到过在跑样例的过程中出现keyerror的报错吗 data:image/s3,"s3://crabby-images/0a781/0a78193822621650ee43e8d51117ff2b8b8a51a4" alt="微信图片_20220508150508"
请问Morvan, DQN的代码中,计算q_target时,是否未考虑done为True的情况,即q_target = Reward? 存储在Replay memory中的经验也未包含done。请问为什么呢?
i want to learn curiosity algoritm .So any example u have?. any explanation?. How can i implement it in ddpg algorithm? Anyone add it for example 2d car work.
我尝试在[代码DDPG_update2.py](https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow/blob/master/contents/9_Deep_Deterministic_Policy_Gradient_DDPG/DDPG_update2.py)中将ep_reward(line: 146)纳入tensorboard监测范畴,但是由于此变量不在计算图中,所以我没找到合适的方法在tensorboard的web界面中实时展示其在训练过程中的变化趋势,想请教下大家有没有好的办法?
DDPG算法,如何进行模型训练保存,不需要每次都训练一次,可以将训练效果最好的一次保存下来吗?
data:image/s3,"s3://crabby-images/cce4f/cce4f89c0e080dec691ce0ffccf0003815465b40" alt="image"
can you give a pytorch example?