reinforcement-learning-kr
reinforcement-learning-kr copied to clipboard
Q-learning epsilon parameter for Epsilon-greedy action selection
1-grid-world/5-q-learning/q_learning_agent.py 에서 epsilon이 0.9로 설정되어 random action 을 자주 하게됩니다.