hanlp-lucene-plugin
hanlp-lucene-plugin copied to clipboard
文本中的换行(\n)很否自动去掉
如果是一个字符串,可以提前把 \n去掉,但是在一个文本中,比如text中,那就需要把text全部读出来,去掉\n在进行分词,很消耗内存。在文本中一个词中间换行,应该很常见的。
如果去掉\n,highlighter就会对不齐。