NLPIR
NLPIR copied to clipboard
如题?多谢回答!!!
请问是否可以提供自带的词频表以供研究?
已确保用户词典编码和程序设置的编码一致,并且KeyExtract_ImportKeyBlackList可以正确返回词典中词的个数,但是提取的关键词结果仍然包含词典中的停用词
语料里面也没有这个词,请问这里为什么会出现?负数是什么意思?
我把nlpir使用jna包装后打成jar包后,无法分词,也没有任何报错,代码如下: private static void init(String argu,int charset_type) { int init_flag = CLibrary.Instance.NLPIR_Init(argu, charset_type, "0"); if (0 == init_flag) { String errorMessage = CLibrary.Instance.NLPIR_GetLastErrorMsg(); System.err.println("初始化失败!fail reason is "+errorMessage); return; } }...
../clucene-core-2.3.3.4/bin/libNLPIR.so: undefined reference to `x2c(char const*)' ../clucene-core-2.3.3.4/bin/libNLPIR.so: undefined reference to `UTF8ToANSI(std::string const&, std::string&)' ../clucene-core-2.3.3.4/bin/libNLPIR.so: undefined reference to `unicode_to_utf8_one(unsigned long, unsigned char*, int)'
老师你好,我使用了KeyExtract_ImportKeyBlackList,导入了UTF-8编码的black.txt(后来又尝试了GBK的),KeyExtract_ImportKeyBlackList能正确返回我导入的停用词个数,但是在getKeyWords时,我设置的停用词仍然在结果中出现。请问是我的black.txt中内容格式的问题吗?我在txt文件中的格式如下: 停用词1 停用词2 停用词3 还是存在其他问题呢?
我使用了其中的ST_GetOneObjectResult函数,然后发现有时候对于相同的文章,我输入不同的对象,输出结果相同。比如使用API说明文档中样例的数据,我分析“郭德纲”和“观众”获得了一样的结果。
/home/seu/experiment/code/SentimentAnalysis/lib/linux64/libLJSentimentAnalysis.so: undefined reference to `unicode_to_utf8_one(unsigned long, unsigned char*, int)' /home/seu/experiment/code/SentimentAnalysis/lib/linux64/libLJSentimentAnalysis.so: undefined reference to `x2c(char const*)' 好像是缺少了其他的库文件
关键词词性的限制
请问关键词提取时可以限制词性么?如‘可以’、'进行'这种词不被选为关键词?