Hongyan Pan
Hongyan Pan
用户词典是txt,一行一个词,和词性用空格隔开,如: 中国 ns 注意txt文本的编码要个初始化指定的编码一致
文档暂时没有整理出来,其实很简单,只是需要把相应的依赖放到索引库的lib里,和在配置文件里指定Data和用户词典的路径,
需要通过用户词导入接口引入用户词典,txt格式
1.release版已经发布,打包需要包含:源代码和resources目录中的文件 2.manage-schema中指定org.nlpir.lucene.cn.ictclas.NLPIRTokenizerFactory类 3.应该支持,可以更改项目中的solr版本,进行适应
缺少jna.jar,将其一同放到solr里 发自我的 iPhone 在 2017年11月21日,下午12:12,Gladiator566 写道: 感谢您的回复! 现在已经可以导入jar包并修改schema配置文件后可以正常启动并建立collection,但现在我遇到的问题是在analyse界面查询text_general字段出错,log中报错为 null:java.lang.RuntimeException: java.lang.NoClassDefFoundError: com/sun/jna/Library 请问这是什么原因呢?谢谢~ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or...
你好: 引入用户词的文本编码,一般要和初始化组件时指定的编码一致 在 2019年5月13日,15:56,aobi12138 写道: 老师你好,我使用了KeyExtract_ImportKeyBlackList,导入了UTF-8编码的black.txt(后来又尝试了GBK的),KeyExtract_ImportKeyBlackList能正确返回我导入的停用词个数,但是在getKeyWords时,我设置的停用词仍然在结果中出现。请问是我的black.txt中内容格式的问题吗?我在txt文件中的格式如下: 停用词1 停用词2 停用词3 还是存在其他问题呢? — You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on...
1.是否有足够的语料训练模型 2.更换计算词试试
本次将进行系统的更新
使用什么语言调用的,调用的什么版本dll
项目地址是哪个