easy-rl
easy-rl copied to clipboard
强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
https://datawhalechina.github.io/easy-rl/#/chapter14/chapter14 Description
查看了报错的信息,应该是提供的simple_grid.py里面的np_random变量的问题,但是不知道怎么解决,所以来此求助,提前感谢大佬的解答。 (Check the error information, should be provided simple_grid.py in the np_random variable problem, but do not know how to solve, so come to this help, thank the big guy...
 上面红框式子是取Q函数的最大值;下面红框式子中对Q函数进行了加权求和,π函数减去一个很小的数,除以一个比1小的数。我想问下这不等式是怎么成立的?
fix a small typo in chap4. 4.2.1中"但是实际上我们是在做采样本来这边应该是一个期望...." 我想应该是缺少了一个句号。“但是实际上我们是在做采样。本来...” (刚好看到就随手提交了)