easy-rl
easy-rl copied to clipboard
/chapter1/chapter1_questions&keywords
https://datawhalechina.github.io/easy-rl/#/chapter1/chapter1_questions&keywords
Description
沙发: 写得太好了!!!
谢谢你的肯定,也希望可以提供更加宝贵的建议,让我们的教程进一步更新,为更多的小伙伴提供帮助。
结合了很多课程的内容,真的太用心了,大大的赞!Interview 那里太好玩了哈哈哈
结合了很多课程的内容,真的太用心了,大大的赞!Interview 那里太好玩了哈哈哈
谢谢你的肯定!希望继续支持我们的项目啦!多提宝贵的意见。
写的太好啦
写的太好啦
谢谢~,最新版的可以看我们的pdf版本,后面会慢慢对于repo中的md文件进行更新。
呜呜呜(泪目),竟然有这么好的教程!
呜呜呜(泪目),竟然有这么好的教程!
感谢您的认可,能对您有所帮助就好!
豁然开朗!
豁然开朗!
能对您有所帮助就好!XD
很好,谢谢
感谢作者,很棒!
高冷的面试官的导数第三问的答案好像有点逻辑小错误?“ 需要通过学习逐渐逼近真实模型的问题并且当前的动作会影响环境的状态,即服从马尔可夫性的问题。”,这个即应该是等价的意思,但是前面的描述和马尔科夫性的定义关联度不大?不知道我理解的对不对,可以讨论一哈。
这里确实不太严谨。“当前的动作会影响环境的状态”和“服从马尔可夫性的问题”,本身都是正确的,但是两者确实无关(关系似有似无😂),或者说不能这样表述。前者表达的意思是智能体的动作执行会影响环境状态,后者表达的意思是未来的概率分布只与当前的状态,不知道你是否同意。谢谢你的建议~
这读物!这作者!相见恨晚!优秀!!感谢!!
这读物!这作者!相见恨晚!优秀!!感谢!!
谢谢支持😃
太棒啦~
太棒啦~
感谢支持 ^V^