tensorflow-tutorial-samples 关于choose

您好，请教下在for i in range(episodes): 下面，也就是第52行，model 还没开始train怎么去做choose_action里的predict？

Dec 23 '20 09:12 xlyue92

运行了300的多个周期依然没有收敛迹象，是不是memory有问题。。。

Apr 19 '22 11:04 AKIRAsamadesu

您好，请教下在for i in range(episodes): 下面，也就是第52行，model 还没开始train怎么去做choose_action里的predict？

還沒train的情況下系統默認每一種 action 機率基本相同，所以一開始action 就是隨機的

Dec 27 '23 06:12 weslythisway

运行了300的多个周期依然没有收敛迹象，是不是memory有问题。。。

運氣問題，起始點不好就跑到local minum，多重跑幾次程式碼就有機會看到收斂

Dec 27 '23 06:12 weslythisway

想請問你的train 為什麼模型只訓練當次 episode ，過去的回合不訓練??

Dec 27 '23 07:12 weslythisway

比較大的問題是不是，model 在 train 的時候程式碼只用單次遊戲的資料進行訓練，並沒有把過去玩的資料一起納入訓練??

Dec 29 '23 01:12 weslythisway

关于choose_action