reinforcement-learning-kr icon indicating copy to clipboard operation
reinforcement-learning-kr copied to clipboard

[파이썬과 케라스로 배우는 강화학습] 예제

Results 31 reinforcement-learning-kr issues
Sort by recently updated
recently updated
newest added

안녕하세요. 1-grid-world 1-policy-iteration 코드 실행 중 다음과 같은 에러가 발생하여 질문드립니다. if __name__ == "__main__": env = Env() policy_iteration = PolicyIteration(env) grid_world = GraphicDisplay(policy_iteration) grid_world.mainloop() Traceback (most recent call last):...

에러 내용 : 예외가 발생했습니다. TypeError get_updates() takes 3 positional arguments but 4 were given File "D:\seungwan\Desktop\AI_Study\AI_Reference\reinforcement-learning-kr-master\1-grid-world\7-reinforce\reinforce_agent.py", line 52, in optimizer updates = optimizer.get_updates(self.model.trainable_weights, [], loss) File "D:\seungwan\Desktop\AI_Study\AI_Reference\reinforcement-learning-kr-master\1-grid-world\7-reinforce\reinforce_agent.py", line 25,...

안녕하세요! 5장의 reinforce 알고리즘을 실습해보기 위해서 1-grid-world/7-reinforce/reinforce_agent.py를 실행시켰는데 다음과 같은 오류가 발생했습니다. ![image](https://user-images.githubusercontent.com/41093239/87219445-1ef36600-c396-11ea-9cb0-320f4d983c7e.png) 값을 4개 전달해야하는 것 같은데 누락된 값이 무엇인지 알 수 있을까요?

안녕하세요 좋은 책으로 강화학습 잘 공부하고 있습니다. mc_learning.py 을 보다가 좀 이해가 안되는 부분이 있어 글을 남깁니다. 코드에서 실제로 에피소드마다 update하는 것은 q함수가 아니라 상태함수인 것 같습니다. 그런데 코멘트에는 q함수를...

1-grid-world/5-q-learning/q_learning_agent.py 에서 epsilon이 0.9로 설정되어 random action 을 자주 하게됩니다.

![주석 2020-08-15 224235](https://user-images.githubusercontent.com/61109695/90315240-d4e13f80-df54-11ea-8ed5-2c4261e69d66.png) 여기 부분이 잘 안되는데 어떤 문제인지 잘 모르겠습니다 ㅠ

가이드 적힌대로3.5버전 다운받고 주욱 진행하다가 python setup.py install 했는데 다음과 같이 계속 나오네요. ![캡처](https://user-images.githubusercontent.com/59506785/71766618-23514900-2f45-11ea-8eaf-5cbb11ed93d5.PNG) setuptools는 이미 깔려있습니다만, 계속 없다고만 합니다. 도움부탁드립니다.

안녕하세요. 좋은 책으로 즐겁게 공부하고 있습니다. p.198에 수식 5.21에 보면 policy gradient theorem에 의해서 유도된 gradient J (theta)가 expectation의 형태로 나타나지는데, 이 부분에 대한 식이 잘 이해가 안되서 Sutton 교수님의...

tensorflow2.0 is installed by requirement.txt