on-policy topic

List on-policy repositories

recurrent-ppo-truncated-bptt

107

Stars

14

Forks

Watchers

Baseline implementation of recurrent PPO using truncated BPTT

deep-reinforcement-learning

episodic-transformer-memory-ppo

147

Stars

17

Forks

Watchers

Clean baseline implementation of PPO using an episodic TransformerXL memory

deep-reinforcement-learning

episodic-memory

gated-transformer-xl

reinforcement_learning_v_mpo

16

Stars

1

Forks

Watchers

Deep Reinforcement Learning by using an on-policy adaptation of Maximum a Posteriori Policy Optimization (MPO)

deep-reinforcement-learning

reinforcement-learning

reinforcement_learning_truly_ppo

17

Stars

1

Forks

Watchers

Deep Reinforcement Learning by using Truly Proximal Policy Optimization in Tensorflow 2 and Pytorch

deep-reinforcement-learning