pkuseg-python
pkuseg-python copied to clipboard
可否共享一下训练语料?
可否共享一下训练语料?
请问怎么训练pkuseg,我发现pkuseg处理地址信息的时候会把数字和汉字分成一个词,我希望添加规则,数字和绝大多数汉字不能组成词,只能和号、楼、室、弄组成词,但是不知道方法,真心求教,万分感谢!