reinforcement-learning-kr
reinforcement-learning-kr copied to clipboard
mc_agent.py 오류 수정 요청
3-monte-carlo/mc_gant.py 에서 31 번째 줄 G_t = self.discount_factor * (reward[1] + G_t) 가 G_t = reward[1] + self.discount_factor *G_t 로 바꾸어야 될거 같습니다.
중대한 실수가 있었네요. 알려주셔서 감사합니다. 다음 쇄를 인쇄할 때 수정하도록 하겠습니다. (코드 버전을 아예 다 업그레이드 할 계획입니다)