Reinforcement-Learning-practice-zh icon indicating copy to clipboard operation
Reinforcement-Learning-practice-zh copied to clipboard

强化学习-中文笔记&资源-以python实例为主-由浅入深

trafficstars

你好,这是刘洪佳的强化学习笔记

第一次系统学习强化学习,本笔记语言为中文。


我的笔记分布

正在进行的学习内容与计划中的内容

  • [X] 强化学习圣经的第一遍学习 [details]
  • [ ] Deep Reinforcement Learning 的第一遍阅读 [details]
  • [ ] Approximate Dynamic Programming 的第一遍阅读 [details]

对强化学习圣经的第一遍学习

输出是最好的学习,我的学习方法如下:

目前已完成:

  • [X] 第I部分 表格型求解方法 学习总结 link
  • [X] 第II部分 表格型近似求解方法
  • [X] 第III部分 表格型深入研究

学习笔记目录(所有的.ipynb链接已转换到nbviewer.jupyter.org/github/):

第I部分 表格型求解方法
第II部分 表格型近似求解方法

深度强化学习第一遍阅读

听说这本综述不错:

Li Y. Deep reinforcement learning: An overview[J]. arXiv preprint arXiv:1701.07274, 2017.

如果想看看论文与代码,可以考虑先看:

https://github.com/ShangtongZhang/DeepRL


近似动态规划的第一遍阅读

在管理中,强化学习(近似动态规划)有哪些应用?老师给我推荐了这本书:

Powell W B. Approximate Dynamic Programming: Solving the curses of dimensionality[M]. John Wiley & Sons, 2007.


参考资料

  • [1] 强化学习(第2版); [加拿大] Richard S. Sutton, [美国] Andrew G. Barto; 俞凯 译.
  • [2] 在上述书籍出版前,有人已经开始了翻译工作:http://rl.qiwihui.com/.
  • [3] 英文电子原版在:http://rl.qiwihui.com/zh_CN/latest/chapter1/introduction.html,已经下载到本仓库./resources/Reinforcement Learning - An Introduction 2018.pdf
  • [4] 强化学习读书笔记系列;公众号:老薛带你学Python(xue_python)

更多平台

"输出是最好的学习方式"——欢迎在其他平台查看我的学习足迹!