THULAC-Python icon indicating copy to clipboard operation
THULAC-Python copied to clipboard

自定义词典分词问题

Open FuXiaoyang0715 opened this issue 1 year ago • 0 comments

问题:用户自定义词典中的词不能够被准确的识别,如我在user_dict中添加了“紫微星”和“旗舰店”,但是在分词“紫微星旗舰店”时模型给出的结果是“紫微星旗”和“舰店”,这与预期大大相反。同样也有其他用户自定义词典未能有效识别的情况。

请问如何将自定义用户词典内的词设置优先级为最高,以词典失效的问题?

FuXiaoyang0715 avatar Dec 25 '23 02:12 FuXiaoyang0715