maddpg-pettingzoo-pytorch issues

Results 6 maddpg-pettingzoo-pytorch issues

Sort by recently updated

一些关于MADDPG的问题

您好，请问要怎么编写DDPG算法作为这个使用MADDPG算法的对比？期待您的回复，谢谢。

适配新版gym=0.25.2和pettingzoo=1.24.1

- 环境渲染模式env.render(mode=“human”)和env.close()问题. 在新版中，需要设置在simple_spread_v3.parallel_env(max_cycles=ep_len,render_mode="rgb_array")中， - evaluate.py中的env.close()应放在for episode in range(args.episode_num)：循环外不然报错gym 'NoneType' object has no attribute 'fill' - 修复指定cuda设备运行的Bug 希望有机会向开源项目贡献，这将是我贡献的第一个开源项目

Lmh-sys

actor_loss损失函数正则项的疑惑

在MADDPG.py中Actor 更新是最大化累积期望回报，即 Q 值，然而这里加上了**Actor 的策略动作概率**平方项均值我们知道在目标函数中加入熵（entropy)项。通过最大化熵(即在loss函数中加入熵的负数）可以使得actor的输出有一定的多样性是否这里Actor 的策略动作概率平方项该取**负号**去最大化**Actor 的策略动作概率**平方项均值 ```python # MADDPG.py actor_loss = -agent.critic_value(list(obs.values()), list(act.values())).mean() actor_loss_pse = torch.pow(logits, 2).mean() agent.update_actor(actor_loss + 1e-3 * actor_loss_pse) ```

Lmh-sys

maddpg-pettingzoo-pytorch
maddpg-pettingzoo-pytorch copied to clipboard

Metadata

一些关于MADDPG的问题

适配新版gym=0.25.2和pettingzoo=1.24.1

actor_loss损失函数正则项的疑惑

evaluate part

训练的simple_tag图不对

simple_spread

← Metadata

Owner

Metadata

maddpg-pettingzoo-pytorch maddpg-pettingzoo-pytorch copied to clipboard

Metadata

一些关于MADDPG的问题

适配新版gym=0.25.2和pettingzoo=1.24.1

actor_loss损失函数正则项的疑惑

evaluate part

训练的simple_tag图不对

simple_spread

← Metadata

Owner

Metadata

maddpg-pettingzoo-pytorch
maddpg-pettingzoo-pytorch copied to clipboard