reinforcement-learning-kr issues

1-grid-world 1-policy-iteration 코드 에러 질문입니다.

안녕하세요. 1-grid-world 1-policy-iteration 코드 실행 중 다음과 같은 에러가 발생하여 질문드립니다. if __name__ == "__main__": env = Env() policy_iteration = PolicyIteration(env) grid_world = GraphicDisplay(policy_iteration) grid_world.mainloop() Traceback (most recent call last):...

lyh1107

코드 실해 해봤는데 # 정책신경망을 업데이트하는 훈련함수 생성 부분에서 에러가 나요

4

에러 내용 : 예외가 발생했습니다. TypeError get_updates() takes 3 positional arguments but 4 were given File "D:\seungwan\Desktop\AI_Study\AI_Reference\reinforcement-learning-kr-master\1-grid-world\7-reinforce\reinforce_agent.py", line 52, in optimizer updates = optimizer.get_updates(self.model.trainable_weights, [], loss) File "D:\seungwan\Desktop\AI_Study\AI_Reference\reinforcement-learning-kr-master\1-grid-world\7-reinforce\reinforce_agent.py", line 25,...

Cinofe

1-grid-world/7-reinforce/reinforce_agent.py 오류

2

안녕하세요! 5장의 reinforce 알고리즘을 실습해보기 위해서 1-grid-world/7-reinforce/reinforce_agent.py를 실행시켰는데 다음과 같은 오류가 발생했습니다. ![image](https://user-images.githubusercontent.com/41093239/87219445-1ef36600-c396-11ea-9cb0-320f4d983c7e.png) 값을 4개 전달해야하는 것 같은데 누락된 값이 무엇인지 알 수 있을까요?

ldahee

MC_learning.py 관련 문의

안녕하세요 좋은 책으로 강화학습 잘 공부하고 있습니다. mc_learning.py 을 보다가 좀 이해가 안되는 부분이 있어 글을 남깁니다. 코드에서 실제로 에피소드마다 update하는 것은 q함수가 아니라 상태함수인 것 같습니다. 그런데 코멘트에는 q함수를...

goodjian7

FIXED: epsilon for e-greedy selection

Linked issue: #56

rrbb014

Q-learning epsilon parameter for Epsilon-greedy action selection

1-grid-world/5-q-learning/q_learning_agent.py 에서 epsilon이 0.9로 설정되어 random action 을 자주 하게됩니다.

rrbb014

아타리 설치가 잘 안됩니다 ㅠㅠ

![주석 2020-08-15 224235](https://user-images.githubusercontent.com/61109695/90315240-d4e13f80-df54-11ea-8ed5-2c4261e69d66.png) 여기 부분이 잘 안되는데 어떤 문제인지 잘 모르겠습니다 ㅠ

wonchan-lee

아타리 브레이크 아웃 설치 과정 오류 생깁니다.

1

가이드 적힌대로3.5버전 다운받고 주욱 진행하다가 python setup.py install 했는데 다음과 같이 계속 나오네요. ![캡처](https://user-images.githubusercontent.com/59506785/71766618-23514900-2f45-11ea-8eaf-5cbb11ed93d5.PNG) setuptools는 이미 깔려있습니다만, 계속 없다고만 합니다. 도움부탁드립니다.

ghost

p.198 수식 5.21 질문

안녕하세요. 좋은 책으로 즐겁게 공부하고 있습니다. p.198에 수식 5.21에 보면 policy gradient theorem에 의해서 유도된 gradient J (theta)가 expectation의 형태로 나타나지는데, 이 부분에 대한 식이 잘 이해가 안되서 Sutton 교수님의...

driedpollack

requirement.txt modified for reliability

2

tensorflow2.0 is installed by requirement.txt

keep9oing

reinforcement-learning-kr
reinforcement-learning-kr copied to clipboard

Metadata

1-grid-world 1-policy-iteration 코드 에러 질문입니다.

코드 실해 해봤는데 # 정책신경망을 업데이트하는 훈련함수 생성 부분에서 에러가 나요

1-grid-world/7-reinforce/reinforce_agent.py 오류

MC_learning.py 관련 문의

FIXED: epsilon for e-greedy selection

Q-learning epsilon parameter for Epsilon-greedy action selection

아타리 설치가 잘 안됩니다 ㅠㅠ

아타리 브레이크 아웃 설치 과정 오류 생깁니다.

p.198 수식 5.21 질문

requirement.txt modified for reliability

← Metadata

Owner

Metadata

reinforcement-learning-kr reinforcement-learning-kr copied to clipboard

Metadata

← Metadata

Owner

Metadata

reinforcement-learning-kr
reinforcement-learning-kr copied to clipboard