policy-gradient
policy-gradient copied to clipboard

→

Metadata

Minimal Monte Carlo Policy Gradient (REINFORCE) Algorithm Implementation in Keras

Readme
Issues

Policy Gradient

Minimal implementation of Stochastic Policy Gradient Algorithm in Keras

Pong Agent

This PG agent seems to get more frequent wins after about 8000 episodes. Below is the score graph.

score

About

Minimal Monte Carlo Policy Gradient (REINFORCE) Algorithm Implementation in Keras

reinforcement-learning

keras

deep-reinforcement-learning

policy-gradient

158

Stars

43

Forks

Watchers

Owner

← Metadata

158

Stars

43

Forks

Watchers

Owner

Metadata

Minimal Monte Carlo Policy Gradient (REINFORCE) Algorithm Implementation in Keras