MPCNN icon indicating copy to clipboard operation
MPCNN copied to clipboard

做dev时也用了train_step

Open charmpeng opened this issue 6 years ago • 2 comments

train.py里的dev_step, 第173行,在做dev时,也用了train_step,这导致了log文件里,每100步做一次dev,但后续的train里,step数都是n+20开始,而不是从n+1开始。

charmpeng avatar Feb 06 '19 03:02 charmpeng

然后在epoch=85,batch size=64的情况下run,7k步时,acc一直都在0.2~0.3间震荡。

charmpeng avatar Feb 06 '19 06:02 charmpeng

train.py里的dev_step, 第173行,在做dev时,也用了train_step,这导致了log文件里,每100步做一次dev,但后续的train里,step数都是n+20开始,而不是从n+1开始。

同发现这个问题,dev里去掉train_step后,准确率一直很低,证明代码的泛化性能很差。最近在看一些优化方法,寻找提高准确率的方法。不知道你还有没有接着研究提高验证准确的方法。

JesseNLP avatar Apr 19 '19 12:04 JesseNLP