mrc-for-flat-nested-ner icon indicating copy to clipboard operation
mrc-for-flat-nested-ner copied to clipboard

Recall低问题

Open YCG09 opened this issue 5 years ago • 1 comments

您好,我的数据集上存在precision明显大于recall的情况,如果想以precision换recall,您可否给点建议?谢谢

YCG09 avatar Aug 29 '20 14:08 YCG09

您好,感谢提问。 如果是domain specific的数据集(医疗,金融,法律等),单纯为了提高recall,可以通过添加字典做同义词匹配等添加规则的方式来实现(通用数据集例如新闻等,可能会因为添加规则会造成precision降低。); 如果是因为数据量小造成模型的recall较低,可以采用标注新的训练数据样本或者采用数据增强的方式。 如果是因为实体分布不平衡,导致的整体recall较低,可以通过优化训练过程(比如将cross entropy替换成focal loss, weighted cross entropy)来提高recall 或者通过提高某一类别的实体recall提高整体的recall。

以上都是我个人的理解,希望您指教。感谢!

ghost avatar Sep 02 '20 06:09 ghost