THULAC-Python
THULAC-Python copied to clipboard
请问为什么txt的格式是utf-8还会出现这个问题
UnicodeDecodeError: 'gbk' codec can't decode byte 0xa8 in position 0: incomplete multibyte sequence
你是处理file时出现的吗,整体code是什么
我这里也出现这个问题
代码如下:
import thulac
import codecs
thu1 = thulac.thulac() thu1.cut_f("input.txt", "output.txt") print('end')