LexiconAugmentedNER icon indicating copy to clipboard operation
LexiconAugmentedNER copied to clipboard

词典构建

Open tiger-jie opened this issue 3 years ago • 3 comments

请问一下词典的构建方式是怎样的呢

tiger-jie avatar Oct 25 '21 09:10 tiger-jie

这个是基于大规模未标注数据用无监督分词方法对其进行分词,根据分词结果构建词典。当然,你也可以基于领域知识扩充词典。

v-mipeng avatar Oct 25 '21 10:10 v-mipeng

这个是基于大规模未标注数据用无监督分词方法对其进行分词,根据分词结果构建词典。当然,你也可以基于领域知识扩充词典。

谢谢您的回复,请问能不能考虑将训练集和验证集的标注实体当作领域词典

tiger-jie avatar Oct 26 '21 01:10 tiger-jie

对比的时候大家用一样的词典就好。

v-mipeng avatar Oct 26 '21 02:10 v-mipeng