TextSum icon indicating copy to clipboard operation
TextSum copied to clipboard

gru训练时val_loss变成了nan

Open Alfonsoever opened this issue 3 years ago • 2 comments

这是学习率需要修改吗

Alfonsoever avatar Nov 04 '22 11:11 Alfonsoever

把学习率降低试试。 建议别用GRU了,效果很差(或者你增加一下GRU的复杂度,然后重新训练)。 直接用预训练模型+微调是更好的选择。

xiaoyu2018 avatar Nov 05 '22 02:11 xiaoyu2018

预训练模型是直接在那个微调里用是吗

Alfonsoever avatar Nov 17 '22 02:11 Alfonsoever