THULAC-Python
THULAC-Python copied to clipboard
自定义词典分词问题
问题:用户自定义词典中的词不能够被准确的识别,如我在user_dict中添加了“紫微星”和“旗舰店”,但是在分词“紫微星旗舰店”时模型给出的结果是“紫微星旗”和“舰店”,这与预期大大相反。同样也有其他用户自定义词典未能有效识别的情况。
请问如何将自定义用户词典内的词设置优先级为最高,以词典失效的问题?