THULAC-Java
THULAC-Java copied to clipboard
关于分词文本中有空行的问题。
老师好,在使用JAVA版分词时,若文本出现空行,该分词器会自动把下一行内容填充到该行(空行),因此会出现重复词频。第一次使用时不会该情况,改变参数segOnly再次调用则会出现。