DeepKE icon indicating copy to clipboard operation
DeepKE copied to clipboard

运行结果 不理想

Open ping40 opened this issue 2 years ago • 2 comments

运行 example/triple下的例子,

text为 河南村镇银行400亿金融犯罪背后:第三方支付平台“功不可没” 背后是周鸿祎雷军还有中国人寿:苦主颗粒无归

输出为:


[2022-07-29 11:45:49,666][__main__][INFO] - [(' ', '[SEP]'), ('周', 'B-YAS'), ('鸿', 'I-YAS'), ('祎', 'I-YAS'), ('雷', 'B-YAS'), ('军', 'I-YAS'), ('中', 'B-CAR'), ('国', 'I-CAR')]
[2022-07-29 11:45:49,666][__main__][INFO] - res001:
[2022-07-29 11:45:49,666][__main__][INFO] - {'周鸿祎': '人物', '雷军': '人物', '中国': '国家'}

.....
[2022-07-29 11:46:06,397][__main__][INFO] - "周鸿祎" 和 "雷军" 在句中关系为:"妻子",置信度为0.48。
[2022-07-29 11:46:06,499][__main__][INFO] - {
  "@context": {
    "妻子": "https://baike.baidu.com/item/%E5%A6%BB%E5%AD%90/52626"
  },
  "@id": "周鸿祎",
  "妻子": {
    "@id": "雷军"
  }
}

[2022-07-29 11:29:25,389][__main__][INFO] - "滴滴" 和 "中国" 在句中关系为:"总部地点",置信度为0.28。
[2022-07-29 11:29:25,474][__main__][INFO] - {
  "@context": {
    "总部地点": "https://baike.baidu.com/item/%E6%80%BB%E9%83%A8"
  },
  "@id": "滴滴",
  "总部地点": {
    "@id": "中国"
  }
}

[2022-07-29 11:46:14,923][__main__][INFO] - "周鸿祎" 和 "中国" 在句中关系为:"国籍",置信度为1.00。
[2022-07-29 11:46:14,924][__main__][INFO] - {
  "@context": {
    "国籍": "https://baike.baidu.com/item/%E5%9B%BD%E7%B1%8D"
  },
  "@id": "周鸿祎",
  "国籍": {
    "@id": "中国"
  }
}
[2022-07-29 11:46:27,754][__main__][INFO] - "雷军" 和 "中国" 在句中关系为:"国籍",置信度为1.00。
[2022-07-29 11:46:27,755][__main__][INFO] - {
  "@context": {
    "国籍": "https://baike.baidu.com/item/%E5%9B%BD%E7%B1%8D"
  },
  "@id": "雷军",
  "国籍": {
    "@id": "中国"
  }
}

我期望的结果是: 实体类型至少包括2个实体:河南村镇银行和400亿 关系上:应该是 金融犯罪。

我测试的模型是:DeepKE-cnSchema下的 ‘DeepKE(NER), BERT-wwm, Chinese’ 和 ‘DeepKE(RE), BERT-wwm, Chinese’。

ping40 avatar Jul 29 '22 04:07 ping40

DeepKE-cnSchema支持的实体类型和关系请参考 https://github.com/zjunlp/DeepKE/blob/main/README_CNSCHEMA_CN.md

xxupiano avatar Jul 29 '22 04:07 xxupiano

您好,DeepKE-cnSchema支持下列范围内的实体关系抽取https://github.com/zjunlp/DeepKE/blob/main/README_CNSCHEMA_CN.md, 如果超出范围内的您可以使用标注的训练语料按文档说明训练自定义的模型。

zxlzr avatar Jul 29 '22 06:07 zxlzr