PaddleNLP 关于readme中应用场景A：文本挖掘/解析模板生成与匹配的问题

关于readme中应用场景A：文本挖掘/解析模板生成与匹配的问题

Open naginoa opened this issue 3 years ago • 4 comments

trafficstars

对于文本使用wordtag进行信息抽取后，如生成readme中的 [作品类_实体][肯定词|是][人物类_实体][场景事件|执导][作品类_概念|电影]

对于这样的模板，我们应该如何进行对句子的匹配呢？readme中没有放实际的例子。

对于wordtag_ie中的set_schema，必须要有实体间的关系，但我们并不需要关系，word_tag也不会抽取关系。

我们如何在不涉及关系的前提下，对句子进行模板匹配，如[作品类_实体][肯定词|是][人物类_实体][场景事件|执导][作品类_概念|电影]

谢谢您

Aug 03 '22 03:08 naginoa

这里说的句子匹配是什么意思了？如果单纯要单纯NER实体的话，使用下面的抽取即可，下面的NER抽取使用的是wordtag模型

Aug 03 '22 06:08 wawltor

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/text_to_knowledge 在这里在readme 应用场景A 中

1659530059628

Aug 03 '22 12:08 naginoa

这里说利用该模板，可以匹配除所有该句式的文本。具体的方式没有给，是需要自己写吗

Aug 03 '22 13:08 naginoa

这里说利用该模板，可以匹配除所有该句式的文本。具体的方式没有给，是需要自己写吗

这个模板匹配需要自己写一下，相对来说比较简单，因为wordtag能抽取出来实体，只要通过简单判断实体是否匹配就行

ner  = Taskflow('ner')
result = ner('xxxxx')

is_match = True
for  type, template_type in zip(result, template)
     if type != template_type:
           is_match = False
           break

Aug 03 '22 14:08 wawltor

This issue is stale because it has been open for 60 days with no activity. 当前issue 60天内无活动，被标记为stale。

Dec 08 '22 02:12 github-actions[bot]

This issue was closed because it has been inactive for 14 days since being marked as stale. 当前issue 被标记为stale已有14天，即将关闭。

Dec 22 '22 16:12 github-actions[bot]

PaddleNLP PaddleNLP copied to clipboard

关于readme中应用场景A：文本挖掘/解析模板生成与匹配 的问题

PaddleNLP
PaddleNLP copied to clipboard

关于readme中应用场景A：文本挖掘/解析模板生成与匹配的问题