jieba
jieba copied to clipboard
启用paddle模式,中文分词词性标注标点符号会被标上v
def cut_word_in_paddle(self, input_str: str): jieba.enable_paddle() # 启动paddle模式。 0.40版之后开始支持,早期版本不支持 # input_str2=self.remove_punctuation(input_str) words = pseg.cut(input_str, use_paddle=True) # logger.info("Paddle Mode: " + '/'.join(list(seg_list))) # return '/'.join(list(seg_list)) for word, flag in words: print('%s %s' % (word, flag))
词性标注结果: 编织袋 n 。 v 8月16日上午7时30分 TIME
测试环境:macOS 11.1 python 3.8.5 jieba:0.42.1 paddlepaddle:2.0.0rc1
同遇此问题,解决了吗?