easy-rl
easy-rl copied to clipboard
/chapter10/chapter10
trafficstars
https://datawhalechina.github.io/easy-rl/#/chapter10/chapter10
Description
我在实践HierarchicalDQN的过程中,发现了以下问题:
- 在task0_train.py的train函数中,似乎agent.meta_memory.push(meta_state, goal, extrinsic_reward, state, done)代码缺一个缩进
- 在task0_train.py的eval函数中,不应该出现agent.update()
- 用原始代码会出现一个断崖式下跌的过程,很难达到示例的效果
- 我修改缩进后,效果更差了。。