KuangJun
KuangJun
自己生成,保证一致就行
这部分暂时还没有深入,如果有好的idea,欢迎交流
而且我们这边是预先定义好关系类别,而不是Open RE, 所以暂时没有涉及到这个问题
@qzhangliming I have uploaded it just now.
relation exaction code in the 'relationExtraction' dir. You can run the demo without this part
@qzhangliming 基本正确,由于网站改版的原因,一些爬虫代码可能不能用了,建议自己爬一下。wikidataSpider中有部分冗余代码和文件,该部分主要目的有4个:1、爬取得到wikidata_relation.csv和wikidata_relation2.csv ,得到知识库中的知识. 2、得到attribute.csv(实体的属性) 3、将知识库中的知识对齐到wikipedia上,得到关系提取数据集 4、得到城市气候等关系 。 可以有选择性的删减或增加自定义内容 KNN分类在属于实体预测这一块,在关系提取之前,predict_label.txt的生成需要KNN
问题1:基于分类方法的关系抽取,每次只看一对实体,如果出现多对,则两两匹配,再进行分类。 问题2: 不清楚你想表达什么意思。
你好,按照你的描述,你的目的是要确定一个句子的关系类型。而我们做的是根据句子的信息抽取实体对之间存在的关系。例如:“氨基酸是组成蛋白质的基本单位,氨基酸通过脱水缩合连成肽链。”这句话中,存在3个实体:氨基酸、蛋白质、肽链。因此我们基于这个样本生成3条数据,每条数据包含其中一对实体的关系。当然,我们还未验证这种方法的效果如何,如果你有更好的办法,欢迎讨论。
关系提取代码参见 https://github.com/thunlp/OpenNRE ,本项目的关系提取模块还未上线
> 关系提取代码参见 https://github.com/thunlp/OpenNRE ,本项目的关系提取模块还未上线 关系提取在relationExtraction 文件夹下