easy-rl icon indicating copy to clipboard operation
easy-rl copied to clipboard

强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/

Results 64 easy-rl issues
Sort by recently updated
recently updated
newest added

https://datawhalechina.github.io/easy-rl/#/chapter14/chapter14 Description

查看了报错的信息,应该是提供的simple_grid.py里面的np_random变量的问题,但是不知道怎么解决,所以来此求助,提前感谢大佬的解答。 (Check the error information, should be provided simple_grid.py in the np_random variable problem, but do not know how to solve, so come to this help, thank the big guy...

![image](https://github.com/user-attachments/assets/352fc80d-f46d-4b4c-9eea-28b34e2901a3) 上面红框式子是取Q函数的最大值;下面红框式子中对Q函数进行了加权求和,π函数减去一个很小的数,除以一个比1小的数。我想问下这不等式是怎么成立的?

fix a small typo in chap4. 4.2.1中"但是实际上我们是在做采样本来这边应该是一个期望...." 我想应该是缺少了一个句号。“但是实际上我们是在做采样。本来...” (刚好看到就随手提交了)