D4PG-pytorch

PyTorch implementation of Distributed Distributional Deterministic Policy Gradients (https://arxiv.org/abs/1804.08617).

d4pg_arch

Implementation was tested on environments from OpenAI Gym.

About

D4PG and D3PG implementations with following features

Project was tested on Ubuntu 18.04, Intel i5 with 4 cores, Nvidia GTX 1080Ti

Run python train.py --config configs/openai/d4pg/walker2d_d4pg.yml

python -m unittest discover

Configs for reproducing curves below can be found in configs directory (num parallel agents = 4).

OpenAI Mujoco

d4pg_results2

DMControl

dmc_d4pg

All results were obtained with configs in configs directory

Continuous control with deep reinforcement learning, [https://arxiv.org/abs/1509.02971]
Distributed Distributional Deterministic Policy Gradients [https://arxiv.org/abs/1804.08617]