Reinforcement-learning-with-tensorflow
Reinforcement-learning-with-tensorflow copied to clipboard
DDPG——当动作为取值范围不同的二维情况应该怎么解决呢?
在我研究的问题中,agent的动作包含两个维度,且两个维度的取值范围不一样,请问怎么解决这个问题呢,谢谢各位的回答先!