jieba icon indicating copy to clipboard operation
jieba copied to clipboard

启用paddle模式,中文分词词性标注标点符号会被标上v

Open xiyao23 opened this issue 3 years ago • 2 comments

def cut_word_in_paddle(self, input_str: str): jieba.enable_paddle() # 启动paddle模式。 0.40版之后开始支持,早期版本不支持 # input_str2=self.remove_punctuation(input_str) words = pseg.cut(input_str, use_paddle=True) # logger.info("Paddle Mode: " + '/'.join(list(seg_list))) # return '/'.join(list(seg_list)) for word, flag in words: print('%s %s' % (word, flag))

词性标注结果: 编织袋 n 。 v 8月16日上午7时30分 TIME

测试环境:macOS 11.1 python 3.8.5 jieba:0.42.1 paddlepaddle:2.0.0rc1

xiyao23 avatar Jan 26 '21 09:01 xiyao23

同遇此问题,解决了吗?

thep0y avatar Jan 30 '21 11:01 thep0y