reinforcement-learning-kr
reinforcement-learning-kr copied to clipboard
[파이썬과 케라스로 배우는 강화학습] 예제
안녕하세요. 1-grid-world 1-policy-iteration 코드 실행 중 다음과 같은 에러가 발생하여 질문드립니다. if __name__ == "__main__": env = Env() policy_iteration = PolicyIteration(env) grid_world = GraphicDisplay(policy_iteration) grid_world.mainloop() Traceback (most recent call last):...
에러 내용 : 예외가 발생했습니다. TypeError get_updates() takes 3 positional arguments but 4 were given File "D:\seungwan\Desktop\AI_Study\AI_Reference\reinforcement-learning-kr-master\1-grid-world\7-reinforce\reinforce_agent.py", line 52, in optimizer updates = optimizer.get_updates(self.model.trainable_weights, [], loss) File "D:\seungwan\Desktop\AI_Study\AI_Reference\reinforcement-learning-kr-master\1-grid-world\7-reinforce\reinforce_agent.py", line 25,...
안녕하세요! 5장의 reinforce 알고리즘을 실습해보기 위해서 1-grid-world/7-reinforce/reinforce_agent.py를 실행시켰는데 다음과 같은 오류가 발생했습니다.  값을 4개 전달해야하는 것 같은데 누락된 값이 무엇인지 알 수 있을까요?
안녕하세요 좋은 책으로 강화학습 잘 공부하고 있습니다. mc_learning.py 을 보다가 좀 이해가 안되는 부분이 있어 글을 남깁니다. 코드에서 실제로 에피소드마다 update하는 것은 q함수가 아니라 상태함수인 것 같습니다. 그런데 코멘트에는 q함수를...
Linked issue: #56
1-grid-world/5-q-learning/q_learning_agent.py 에서 epsilon이 0.9로 설정되어 random action 을 자주 하게됩니다.
 여기 부분이 잘 안되는데 어떤 문제인지 잘 모르겠습니다 ㅠ
가이드 적힌대로3.5버전 다운받고 주욱 진행하다가 python setup.py install 했는데 다음과 같이 계속 나오네요.  setuptools는 이미 깔려있습니다만, 계속 없다고만 합니다. 도움부탁드립니다.
안녕하세요. 좋은 책으로 즐겁게 공부하고 있습니다. p.198에 수식 5.21에 보면 policy gradient theorem에 의해서 유도된 gradient J (theta)가 expectation의 형태로 나타나지는데, 이 부분에 대한 식이 잘 이해가 안되서 Sutton 교수님의...
tensorflow2.0 is installed by requirement.txt