biaffine-ner
biaffine-ner copied to clipboard
loss函数
非常好的工作! 有个疑问,请问假设最后构建出来矩阵为:[batch_size, seq_lenth, seq_lenth, num_labels],是否考虑过使用多标签分类的loss来优化呢?
常用的数据集暂时没有这样的需求所以我也没有试过,估计是可以的你把loss改成sigmoid应该就可以的。我之前的mention detecter的论文里面用的就是sigmoid函数(不过是binary的,num_labels = 1) 所以应该可行的。