Counterfactual-Multi-Agent-Policy-Gradients
Counterfactual-Multi-Agent-Policy-Gradients copied to clipboard

Published 20 hours ago •

matteokarldonati

→

Metadata

PyTorch implementation of Foerster, Jakob N., et al. "Counterfactual multi-agent policy gradients."

Reame
Issues

Results 2 Counterfactual-Multi-Agent-Policy-Gradients issues

Sort by recently updated

Why is there no GRU in the actor network? I saw that there was in the original COMA text.

![image](https://github.com/matteokarldonati/Counterfactual-Multi-Agent-Policy-Gradients/assets/125025612/40467c1e-aa00-4509-88a2-83eec0358a5f) ![image](https://github.com/matteokarldonati/Counterfactual-Multi-Agent-Policy-Gradients/assets/125025612/ea3cfa0e-e71c-4eda-a03d-30b934f2da8d)

zhangmazi123321

Bad results sometimes occurred

2

![output](https://user-images.githubusercontent.com/9446592/181408032-84af230c-b2c4-486f-9b72-4c6420ecd12c.png) I repeat running the code and sometimes the learning curve drops during training.

hccz95

About

PyTorch implementation of Foerster, Jakob N., et al. "Counterfactual multi-agent policy gradients."

reinforcement-learning

deep-reinforcement-learning

multi-agent-reinforcement-learning

49

Stars

11

Forks

Watchers

Owner

matteokarldonati

← Metadata

49

Stars

11

Forks

Watchers

Owner

matteokarldonati

Metadata

PyTorch implementation of Foerster, Jakob N., et al. "Counterfactual multi-agent policy gradients."

Back

Counterfactual-Multi-Agent-Policy-Gradients Counterfactual-Multi-Agent-Policy-Gradients copied to clipboard

Metadata

Why is there no GRU in the actor network? I saw that there was in the original COMA text.

Bad results sometimes occurred

← Metadata

Owner

Metadata

Counterfactual-Multi-Agent-Policy-Gradients
Counterfactual-Multi-Agent-Policy-Gradients copied to clipboard