reinforcement-learning-an-introduction-chinese icon indicating copy to clipboard operation
reinforcement-learning-an-introduction-chinese copied to clipboard

《Reinforcement Learning: An Introduction》(第二版)中文翻译

Results 8 reinforcement-learning-an-introduction-chinese issues
Sort by recently updated
recently updated
newest added

10.1的pseudocode里面 ,"如果 𝑆′**不是**终点"大概是译反了,多了一个否定词,应该是"如果 𝑆′**是**终点" (更新w去下一个episode)

官方译文是老师给学生安排的一人一章翻译任务,整体看来质量并不是那么好,希望作者也能跟进翻译,支持作者

第一张强化学习中的dynamical system theory theory是否应该译为动力系统理论而非动态规划(dynamic programming)?

公式(7)下面的“注意,对于样本平均情况……”一行所说的“恒定步长参数的情况“下,α_n(α)=n应该改为α_n(α)=α?

“ 这种情况下就算庄家也是natural也判玩家赢,这种情况叫draw,游戏结束。” 翻译错了,原文是 He then wins unless the dealer also has a natural, in which case the game is a draw. 应该翻译为:他将赢得比赛,除非庄家也有natural,这种情况下,游戏将是平局。 另外,natural翻译为:天然,天然牌,天牌?