easy-rl /chapter1/chapter1_questions&keywords

https://datawhalechina.github.io/easy-rl/#/chapter1/chapter1_questions&keywords

Description

May 15 '21 05:05 qiwang067

沙发：写得太好了！！！

Aug 06 '21 10:08 Sunnyzhr

谢谢你的肯定，也希望可以提供更加宝贵的建议，让我们的教程进一步更新，为更多的小伙伴提供帮助。

Aug 07 '21 05:08 yyysjz1997

结合了很多课程的内容，真的太用心了，大大的赞！Interview 那里太好玩了哈哈哈

Aug 25 '21 10:08 randaldong

结合了很多课程的内容，真的太用心了，大大的赞！Interview 那里太好玩了哈哈哈

谢谢你的肯定！希望继续支持我们的项目啦！多提宝贵的意见。

Aug 25 '21 11:08 yyysjz1997

写的太好啦

Oct 29 '21 06:10 Strawberry47

写的太好啦

谢谢~，最新版的可以看我们的pdf版本，后面会慢慢对于repo中的md文件进行更新。

Oct 29 '21 08:10 yyysjz1997

呜呜呜（泪目），竟然有这么好的教程！

Nov 04 '21 09:11 Coder-Liuu

呜呜呜（泪目），竟然有这么好的教程！

感谢您的认可，能对您有所帮助就好！

Nov 06 '21 11:11 qiwang067

豁然开朗！

Feb 23 '22 09:02 3832YLMa

豁然开朗！

能对您有所帮助就好！XD

Feb 23 '22 12:02 qiwang067

很好，谢谢

Mar 07 '22 02:03 wo767990185

感谢作者，很棒！

Apr 07 '22 09:04 Chx121386

高冷的面试官的导数第三问的答案好像有点逻辑小错误？“ 需要通过学习逐渐逼近真实模型的问题并且当前的动作会影响环境的状态,即服从马尔可夫性的问题。”，这个即应该是等价的意思，但是前面的描述和马尔科夫性的定义关联度不大？不知道我理解的对不对，可以讨论一哈。

Apr 21 '22 08:04 violaBook

这里确实不太严谨。“当前的动作会影响环境的状态”和“服从马尔可夫性的问题”，本身都是正确的，但是两者确实无关（关系似有似无😂），或者说不能这样表述。前者表达的意思是智能体的动作执行会影响环境状态，后者表达的意思是未来的概率分布只与当前的状态，不知道你是否同意。谢谢你的建议～

Apr 21 '22 11:04 yyysjz1997

这读物！这作者！相见恨晚！优秀！！感谢！！

May 11 '23 10:05 Hartrrem

这读物！这作者！相见恨晚！优秀！！感谢！！

谢谢支持😃

May 11 '23 21:05 yyysjz1997

太棒啦~

Aug 27 '23 06:08 zwtnewbee

太棒啦~

感谢支持 ^V^

Aug 27 '23 09:08 qiwang067

easy-rl easy-rl copied to clipboard