a-deep-rl-approach-for-sdn-routing-optimization
a-deep-rl-approach-for-sdn-routing-optimization copied to clipboard

Published 20 hours ago •

Reame
Issues

关于状态的疑问

Open wqhcug opened this issue 6 years ago • 0 comments

您好，我最近也看了这篇论文。最大的疑惑是他的new_state为何是直接产生的，而不是通过每一step的action产生的？这样不符合强化学习的逻辑，请问您有什么见解？谢谢

Dec 24 '18 14:12 wqhcug