Counterfactual-Multi-Agent-Policy-Gradients
Counterfactual-Multi-Agent-Policy-Gradients copied to clipboard

Published 20 hours ago •

→

PyTorch implementation of Foerster, Jakob N., et al. "Counterfactual multi-agent policy gradients."

Pytorch implementation of Counterfactual Multi Agent Policy Gradients

Paper: https://arxiv.org/abs/1705.08926

The model was tested on the ma-gym Switch2-v0 environment (https://github.com/koulanurag/ma-gym/wiki/Environments#Switch)

Policy:

Policy

Learning Curve:

Learning Curve

PyTorch implementation of Foerster, Jakob N., et al. "Counterfactual multi-agent policy gradients."

reinforcement-learning

deep-reinforcement-learning

multi-agent-reinforcement-learning

Stars

Forks

Watchers

Stars

Forks

Watchers

PyTorch implementation of Foerster, Jakob N., et al. "Counterfactual multi-agent policy gradients."