PaddleNLP icon indicating copy to clipboard operation
PaddleNLP copied to clipboard

[Question]: 使用Taskflow进行information_extraction任务中的实体抽取时,能否使得实体对应的文本内容索引不相交?

Open Mnanazi opened this issue 2 years ago • 1 comments

请提出你的问题

在使用Taskflow进行实体抽取时发现似乎是针对schema中的每个实体都遍历一次输入文本,以查询是否包含schema中的定义实体。具体例子见下图,但是我期望实体对应的内容索引在输入文本中不相交,即对于下图['人物':[{'start': 10, 'end': 15, 'text': '卡尔·文森'}]]和['武器':[{'start': 9, 'end': 19, 'text': '"卡尔·文森"号航母'}]]索引相交了,人物实体'卡尔·文森'实际上在输入文本中是武器实体 '"卡尔·文森"号航母'的内容。请问能否通过修改Taskflow或者ie(inputStr),使得实体抽取任务对应的实体内容索引在输入文本中不相交? issue

Mnanazi avatar Sep 01 '23 01:09 Mnanazi

可以的,根据抽取的start,end索引来找对应的上下文。

w5688414 avatar Apr 29 '24 07:04 w5688414