MARL-code-pytorch
MARL-code-pytorch copied to clipboard
mappo测试和训练差异较大
移植该仓库代码,出现一个问题,就是训练的时候reward确实增大,但是测试时候reward很低,几乎没有上升趋势?有人出现过这个问题吗
hxd,你是训练好之后load的model嘛?我load进来的model胜率和reward也是很低,不知道为啥
解决了吗