zjbit
Results
3
comments of
zjbit
ds设置成1就不能跑,爆显存,最多只能设成ds=2,是不是得设成多卡模型并行来训练
ds=2在1080ti可以跑,1就不行,是不是得多卡模型并行呢?好像ds=2无法达到论文中的精度
我后来batch改成4,可以姿训练了,按照ds=1,效果就好很多了