PromDA icon indicating copy to clipboard operation
PromDA copied to clipboard

关于学习率以及复现结果

Open Sihan-Song opened this issue 2 years ago • 0 comments

您好,您在论文中提到的是pretrain和fine-tune阶段都使用1e-3作为学习率,但是在复现的时候,使用1e-3来finetune的效果很差,而使用0.3的效果要好一些,请问您实验时的最优学习率是多少呢? 感谢。

Sihan-Song avatar Jul 21 '22 12:07 Sihan-Song