PyTorch_BERT_Biaffine_NER
PyTorch_BERT_Biaffine_NER copied to clipboard
老哥,有个问题,急
大佬你好,我参考你的代码,只不过最后softmax换成了sigmoid,用bceLoss来做多标签分类,但是模型一直不收敛,loss每次下降一会儿就震荡了,我都调试n天了还是没解决,老哥能否交流下。 ps:使用的electra large,有没有可能是太稀疏导致的
为什么要改成sigmoid呢,是因为一个实体可能同时属于几个类别吗?模型不收敛原因很多,可能是学习率设置得太大,也可能是标签空间太稀疏导致收敛太慢,也可能是数据本身不好区分或者标签设置不合理的原因。