PromDA
PromDA copied to clipboard
关于学习率以及复现结果
您好,您在论文中提到的是pretrain和fine-tune阶段都使用1e-3作为学习率,但是在复现的时候,使用1e-3来finetune的效果很差,而使用0.3的效果要好一些,请问您实验时的最优学习率是多少呢? 感谢。