Batch_Parallel_LatticeLSTM icon indicating copy to clipboard operation
Batch_Parallel_LatticeLSTM copied to clipboard

batch_size不能太大吗?

Open czy36mengfei opened this issue 4 years ago • 6 comments

我用的是人民日报的数据训练的,batch_size为64,效果不好,请您那边训练的时候,batch_size对训练结果的影响怎么样?

czy36mengfei avatar Feb 24 '20 03:02 czy36mengfei

对于NER任务的超参数选择来说,batch_size是不能太大的

LeeSureman avatar Feb 28 '20 07:02 LeeSureman

请问按您的实验,batch_size的范围是多少,为多少的时候最好?batch_size小训练起来太慢了~ @LeeSureman

czy36mengfei avatar Feb 28 '20 07:02 czy36mengfei

原作者的代码里选择为4个数据集选择的batch size都是1,我的代码里也有针对其中三个数据集的batch size设置,我没有做过人民日报的实验

LeeSureman avatar Feb 28 '20 07:02 LeeSureman

@LeeSureman 谢谢。 所以您里面的设置是您的代码中得分最高的batch_size?即ontonote,weibo时batch_size=10得分比batch_size为1高,resume的batch_size为1时得分最高?

if args.dataset == 'ontonote': args.batch = 10 args.lr = 0.045 elif args.dataset == 'resume': args.batch = 1 args.lr = 0.015 elif args.dataset == 'weibo': args.batch = 10 args.gaz_dropout = 0.1 args.embed_dropout = 0.1 args.output_dropout = 0.1 elif args.dataset == 'weibo_old': args.embed_dropout = 0.1 args.output_dropout = 0.1

czy36mengfei avatar Feb 28 '20 08:02 czy36mengfei

是的

LeeSureman avatar Feb 28 '20 08:02 LeeSureman

是的

好的,谢谢。

czy36mengfei avatar Feb 28 '20 08:02 czy36mengfei