easy-rl 用Atari的pong游戏代替CartPole策略网络会发生错误

用Atari的pong游戏代替CartPole策略网络会发生错误

Open wing-on opened this issue 3 years ago • 1 comments

我直接把大佬你的PGconfig类中的环境名‘self.env = 'CartPole-v0'，改成 self.env = 'PongDeterministic-v4'，其他没有任何改动，但是出错了。产生了如下错误：RuntimeError: mat1 and mat2 shapes cannot be multiplied (33600x3 and 210x36)。我看了看觉得是在两个游戏的状态维度不同导致错误，pong的state为（210,160,3），而CartPole-v0的state为（4，），pong在策略网络模型的forward函数向前传递state时就产生错误了。不知道具体错误原因是什么，希望作者大佬能帮忙解答一下。不胜感激！

Dec 02 '21 13:12 wing-on

PongDeterministic-v4

这个环境需要用到卷积神经网络，最近会加

Dec 22 '21 07:12 johnjim0816

easy-rl easy-rl copied to clipboard

用Atari的pong游戏代替CartPole策略网络会发生错误

easy-rl
easy-rl copied to clipboard