proximal-policy-optimization topics

This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are st...

TianhongDai

a2c

actor-critic

algorithm

atari2600

walk_the_blocks

29

Stars

9

Forks

Watchers

Implementation of Scheduled Policy Optimization for task-oriented language grouding

xwhan

ijcai-18

proximal-policy-optimization

reinforcement-learning

task-oriented-language-grounding

cleanrl

4.6k

Stars

544

Forks

Watchers

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

vwxyzjn

a2c

actor-critic

advantage-actor-critic

ale

imitation_learning

128

Stars

14

Forks

Watchers

PyTorch implementation of some reinforcement learning algorithms: A2C, PPO, Behavioral Cloning from Observation (BCO), GAIL.

CherryPieSexy

a2c

advantage-actor-critic

deep-learning

deep-reinforcement-learning

recurrent-ppo-truncated-bptt

107

Stars

14

Forks

Watchers

Baseline implementation of recurrent PPO using truncated BPTT

MarcoMeter

actor-critic

bptt

deep-learning

deep-reinforcement-learning

pytorch-a2c-ppo-acktr-gail

3.5k

Stars

831

Forks

Watchers

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR)...

ikostrikov

a2c

acktr

actor-critic

advantage-actor-critic