blog TensorFlow 2.0 (七) - 强化学习 Q-Learning 玩转 OpenAI gym

TensorFlow 2.0 (七) - 强化学习 Q-Learning 玩转 OpenAI gym | 极客兔兔

Open geektutu opened this issue 6 years ago • 7 comments

https://geektutu.com/post/tensorflow2-gym-q-learning.html

TensorFlow 2.0 入门系列文章，第七篇，Q-Learning 玩转 OpenAI gym game MountainCar-v0。

Jun 25 '19 18:06 geektutu

tensorflow2.0好评

Dec 27 '19 12:12 coach00

強化學習的這系列實在很有幫助由淺入深又配合新版tf

Mar 28 '20 12:03 sunrimii

训练模型，开始部分随机探索和利用的程序写反了导致前1/3训练没有用，调一下位置效果明显

Nov 19 '20 02:11 zsk2019

@zsk2019 可以更具体了么，比如贴出改动点？

Nov 22 '20 14:11 geektutu

可以把这个和同名的原文件比较一下，这个一共训练5000次达到了和以前10000次相当的效果

在 2020-11-22 22:24:58，"Dai Jie" [email protected] 写道：

@zsk2019 可以更具体了么，比如贴出改动点？

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

Nov 25 '20 09:11 zsk2019

最近在跟着兔兔学习，你的代码有些地方确实很优美啊！！赞！写得也相当详细！支持！

Oct 30 '21 07:10 miaografa

我尝试在前期指定初始位置开始模拟训练。通过在每轮训练开始，设置env.state，使得从山峰较高处开始训练，这样就能较快到达小旗子，从末尾开始Q-Tabel的迭代。

结果是得分更加稳定了，只是个有趣的观察。

Nov 01 '21 07:11 miaografa