jieba icon indicating copy to clipboard operation
jieba copied to clipboard

如何实现单个字的分词及统计,希望能画出单个字的云图

Open myqf555 opened this issue 6 years ago • 2 comments

很多问题都是针对2个字以上词语进行分词的,如何利用JIEBA进行单个字的分词,研究需要研究单个字的出现词频,不需要词组词频,请指点

myqf555 avatar Apr 02 '18 03:04 myqf555

单字切分不需要结巴了吧?先去停用词,去标点符号 corpus = '我永远喜欢结城明日奈' list = [] for each in corpus: list.append(each)

ShenMinXu avatar Apr 02 '18 08:04 ShenMinXu

单个词还是有意义的,例如:上海牛肉带价报盘群 我想搜与牛有关的群,结巴分词以后,用牛是搜不出来这个文本的,用牛肉才可以

单个字切分还是很有必要。

huster-songtao avatar Mar 18 '22 13:03 huster-songtao