nlp-tutorial
nlp-tutorial copied to clipboard
BERT存在两个严重问题
1.随机替换成词表中的其他词时应该排除[PAD],[CLS],[SEP],[MASK],否则预测模型会学会预测这些词。 2.学习率开大了,始终难以收敛,开1e-6很合适。
您的邮件我已收到,将尽快回复!!
如图,重新修改后效果非常好