Alex Beng

Results 12 comments of Alex Beng

idk, i just test it in 1080p & 900p. I think I was being presumptuous at that time.

我这边的计划是先模仿学习再强化学习fine tune,目前是模仿学习整个训练+部署基本都做完了,但是效果很差(实际上应该说是效果差才会想到去强化学习微调)。目前刚入职,已经很久没推进度了。 基于学习的方法比人工策略(就是脚本啦)的好处在于新增任务只需要示教,坏处是需要花时间让机器learning,且应该要强化学习微调,且每个任务都需要一个权重,任务多了之后需要大量的磁盘来存放。当然,终极目标可以训练一整个大网络完全模拟人类每天的操作(那为啥玩游戏啊)。 PS:实际上可以等鸭蛋弄个脚本,然后我用脚本示教(bushi)