PyTorch_BERT_Biaffine_NER icon indicating copy to clipboard operation
PyTorch_BERT_Biaffine_NER copied to clipboard

老哥,有个问题,急

Open tankland opened this issue 3 years ago • 1 comments

大佬你好,我参考你的代码,只不过最后softmax换成了sigmoid,用bceLoss来做多标签分类,但是模型一直不收敛,loss每次下降一会儿就震荡了,我都调试n天了还是没解决,老哥能否交流下。 ps:使用的electra large,有没有可能是太稀疏导致的

tankland avatar May 21 '21 03:05 tankland

为什么要改成sigmoid呢,是因为一个实体可能同时属于几个类别吗?模型不收敛原因很多,可能是学习率设置得太大,也可能是标签空间太稀疏导致收敛太慢,也可能是数据本身不好区分或者标签设置不合理的原因。

suolyer avatar May 28 '21 04:05 suolyer