RL-Stock
RL-Stock copied to clipboard
每次训练结果都不一样
已经设置了seed=1234,这个太奇怪了
强化学习是这样的,每次不一样,建议保存效果最好的模型,然后学习率衰减之后再跑