jieba
jieba copied to clipboard
如何实现单个字的分词及统计,希望能画出单个字的云图
很多问题都是针对2个字以上词语进行分词的,如何利用JIEBA进行单个字的分词,研究需要研究单个字的出现词频,不需要词组词频,请指点
单字切分不需要结巴了吧?先去停用词,去标点符号 corpus = '我永远喜欢结城明日奈' list = [] for each in corpus: list.append(each)
单个词还是有意义的,例如:上海牛肉带价报盘群 我想搜与牛有关的群,结巴分词以后,用牛是搜不出来这个文本的,用牛肉才可以
单个字切分还是很有必要。