blog icon indicating copy to clipboard operation
blog copied to clipboard

TensorFlow 2.0 (七) - 强化学习 Q-Learning 玩转 OpenAI gym | 极客兔兔

Open geektutu opened this issue 5 years ago • 7 comments

https://geektutu.com/post/tensorflow2-gym-q-learning.html

TensorFlow 2.0 入门系列文章,第七篇,Q-Learning 玩转 OpenAI gym game MountainCar-v0。

geektutu avatar Jun 25 '19 18:06 geektutu

tensorflow2.0好评

coach00 avatar Dec 27 '19 12:12 coach00

強化學習的這系列實在很有幫助 由淺入深 又配合新版tf

sunrimii avatar Mar 28 '20 12:03 sunrimii

训练模型,开始部分随机探索和利用的程序写反了导致前1/3训练没有用,调一下位置效果明显

zsk2019 avatar Nov 19 '20 02:11 zsk2019

@zsk2019 可以更具体了么,比如贴出改动点?

geektutu avatar Nov 22 '20 14:11 geektutu

可以把这个和同名的原文件比较一下,这个一共训练5000次达到了和以前10000次相当的效果

在 2020-11-22 22:24:58,"Dai Jie" [email protected] 写道:

@zsk2019 可以更具体了么,比如贴出改动点?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

zsk2019 avatar Nov 25 '20 09:11 zsk2019

最近在跟着兔兔学习,你的代码有些地方确实很优美啊!!赞! 写得也相当详细!支持!

miaografa avatar Oct 30 '21 07:10 miaografa

我尝试在前期指定初始位置开始模拟训练。通过在每轮训练开始,设置env.state,使得从山峰较高处开始训练,这样就能较快到达小旗子,从末尾开始Q-Tabel的迭代。

结果是得分更加稳定了,只是个有趣的观察。

miaografa avatar Nov 01 '21 07:11 miaografa