您好,按照说明将项目导入eclipse,运行程序时出现以下错误,请您指教。
====== gAnswer2.0 over DBpedia ======
Adding annotator tokenize
Exception in thread "main" java.lang.NoSuchMethodError: edu.stanford.nlp.process.PTBTokenizer.factory(ZZ)Ledu/stanford/nlp/objectbank/TokenizerFactory;
at edu.stanford.nlp.pipeline.PTBTokenizerAnnotator.
你好,请确认下载了对应分支下的lib文件,并在eclipse项目中将下载的jar包全部加入path。(build path->add external jars ->选择相应jar包)
是我把jar包导错了,谢谢您! 继续向您请教,我的笔记本是8G内存,启动程序会抛出内存溢出的异常,请问您这边有小规模的数据集吗?或者,我该如何把现有的数据集改成小规模的?
Hi, please read the Quick Start to find the smaller dataset.
您好,这个是英文数据集,请问有中文的吗?
中文目前没有提供更小规模的数据集,目前的数据规模16g内存是可以跑的。您可以自行从完整pkubase triples文件抽取小规模子集,通过 generate_fragments/ 中的代码生成相应索引文件。
好的,谢谢您!