TextSum
TextSum copied to clipboard
gru训练时val_loss变成了nan
这是学习率需要修改吗
把学习率降低试试。 建议别用GRU了,效果很差(或者你增加一下GRU的复杂度,然后重新训练)。 直接用预训练模型+微调是更好的选择。
预训练模型是直接在那个微调里用是吗