reinforcement-learning-an-introduction-chinese
reinforcement-learning-an-introduction-chinese copied to clipboard
(第2章) 2.5 追踪非平稳问题
公式(7)下面的“注意,对于样本平均情况……”一行所说的“恒定步长参数的情况“下,α_n(α)=n应该改为α_n(α)=α?