FlappyPaddle
FlappyPaddle copied to clipboard
FlappyPaddle
预览视频看这里:
第一届Flappy Paddle大赛 从一分五十秒开始比赛
训练了三个
- 两个hidden layer (modelsm_16400_95.8.ckpt)
- 三个hidden layer (model3_8400_1256.2.ckpt)
- 三个hidden layer+前两帧的obs直接concat作为输入(modelconcat_30900_157.6.ckpt)
环境
注意parl必须是1.3.1,pygame必须是1.9.6
修改了flappy game的init,可以直接跑三个agent了,所以如果你想在环境中评比几个算法现在也是可行的了(如果想要更精简的环境可以参考PeopleVSRL分支)
提供三种颜色队伍的图片
以上都按照环境本来的文件夹格式提供。
所以你也可以和我一起比,修改run3Agent中添加你的model、algorithm、agent,你一定可以看懂。
【BUG】:
不知道啥情况,第一个agent操作了第二个队伍,第二个agent操作第一个队伍,还在排查中
【20200702】不是bug,是pygame或opencv的图像通道不统一的问题,两者的RGB顺序应该不一样。
第一届paddlepaddle杯Flappy Paddle大赛
最后的比赛成绩红队143分,黑队125分,蓝队1003分
分支PeopleVSRL是支持用户操作和机器比赛的模式
许可证书
本项目的发布受Apache 2.0 license许可认证。