open-entity-relation-extraction icon indicating copy to clipboard operation
open-entity-relation-extraction copied to clipboard

为什么我给的简单句子,大部分都提取不出三元组,比如图中的例子。

Open XuZhen001 opened this issue 5 years ago • 11 comments

image

XuZhen001 avatar Aug 30 '19 06:08 XuZhen001

目前只能保证7种DSNF范式,而且这个前提是依存句法正确得到解析。

lemonhu avatar Aug 30 '19 07:08 lemonhu

这个跟词典有关系吗,resource里面只提供了法律方面的词典,加个通用词典效果会好一点吗?

XuZhen001 avatar Aug 30 '19 07:08 XuZhen001

image 这个为什么都提不了呢,这个不是标准的“n-v-n”结构吗?谢谢解答

XuZhen001 avatar Aug 30 '19 07:08 XuZhen001

添加用户词典,只是有助于分词这一步。

建立关系的候选实体集合为{'ns', 'ni', 'nh', 'nz', 'j'},可见entity_combine.py

lemonhu avatar Aug 30 '19 08:08 lemonhu

好的,非常感谢,那么你觉得怎么改进呢,比如可以识别更多句法什么的,要大致怎么改呢?

XuZhen001 avatar Aug 30 '19 08:08 XuZhen001

这份工作的贡献就是基于依存句法制定抽取范式,我认为可以从以下两个方面提高:

  1. 制定更多的抽取范式,而范式的制定需要较深的语言学知识,当然规则的复杂性可能会随之增加。
  2. 实际测试中,长句子的依存句法解析依然比较困难,可以尝试解决长句子的依存解析不准的问题。

lemonhu avatar Aug 30 '19 12:08 lemonhu

好的,非常感谢

XuZhen001 avatar Aug 31 '19 01:08 XuZhen001

用自己训练的命名实体识别+结巴分词能优化很多大准确率,谢谢作者的贡献

sssdjj avatar Oct 31 '19 10:10 sssdjj

用自己训练的命名实体识别+结巴分词能优化很多大准确率,谢谢作者的贡献

您好,可以请教下具体怎么改进的吗

Bernard-Yang avatar Mar 07 '20 05:03 Bernard-Yang

用自己训练的命名实体识别+结巴分词能优化很多大准确率,谢谢作者的贡献

是嘛,我目前从分词,词性标注,命名实体识别,依存分析还是清一色的LTP。

tianyunzhe avatar Mar 18 '20 04:03 tianyunzhe

用自己训练的命名实体识别+结巴分词能优化很多大准确率,谢谢作者的贡献

您好,想问一下怎样可以训练自己的数据。

onion0925 avatar Mar 15 '22 11:03 onion0925