DeepKE
DeepKE copied to clipboard
运行结果 不理想
运行 example/triple下的例子,
text为 河南村镇银行400亿金融犯罪背后:第三方支付平台“功不可没” 背后是周鸿祎雷军还有中国人寿:苦主颗粒无归
输出为:
[2022-07-29 11:45:49,666][__main__][INFO] - [(' ', '[SEP]'), ('周', 'B-YAS'), ('鸿', 'I-YAS'), ('祎', 'I-YAS'), ('雷', 'B-YAS'), ('军', 'I-YAS'), ('中', 'B-CAR'), ('国', 'I-CAR')]
[2022-07-29 11:45:49,666][__main__][INFO] - res001:
[2022-07-29 11:45:49,666][__main__][INFO] - {'周鸿祎': '人物', '雷军': '人物', '中国': '国家'}
.....
[2022-07-29 11:46:06,397][__main__][INFO] - "周鸿祎" 和 "雷军" 在句中关系为:"妻子",置信度为0.48。
[2022-07-29 11:46:06,499][__main__][INFO] - {
"@context": {
"妻子": "https://baike.baidu.com/item/%E5%A6%BB%E5%AD%90/52626"
},
"@id": "周鸿祎",
"妻子": {
"@id": "雷军"
}
}
[2022-07-29 11:29:25,389][__main__][INFO] - "滴滴" 和 "中国" 在句中关系为:"总部地点",置信度为0.28。
[2022-07-29 11:29:25,474][__main__][INFO] - {
"@context": {
"总部地点": "https://baike.baidu.com/item/%E6%80%BB%E9%83%A8"
},
"@id": "滴滴",
"总部地点": {
"@id": "中国"
}
}
[2022-07-29 11:46:14,923][__main__][INFO] - "周鸿祎" 和 "中国" 在句中关系为:"国籍",置信度为1.00。
[2022-07-29 11:46:14,924][__main__][INFO] - {
"@context": {
"国籍": "https://baike.baidu.com/item/%E5%9B%BD%E7%B1%8D"
},
"@id": "周鸿祎",
"国籍": {
"@id": "中国"
}
}
[2022-07-29 11:46:27,754][__main__][INFO] - "雷军" 和 "中国" 在句中关系为:"国籍",置信度为1.00。
[2022-07-29 11:46:27,755][__main__][INFO] - {
"@context": {
"国籍": "https://baike.baidu.com/item/%E5%9B%BD%E7%B1%8D"
},
"@id": "雷军",
"国籍": {
"@id": "中国"
}
}
我期望的结果是: 实体类型至少包括2个实体:河南村镇银行和400亿 关系上:应该是 金融犯罪。
我测试的模型是:DeepKE-cnSchema下的 ‘DeepKE(NER), BERT-wwm, Chinese’ 和 ‘DeepKE(RE), BERT-wwm, Chinese’。
DeepKE-cnSchema支持的实体类型和关系请参考 https://github.com/zjunlp/DeepKE/blob/main/README_CNSCHEMA_CN.md
您好,DeepKE-cnSchema支持下列范围内的实体关系抽取https://github.com/zjunlp/DeepKE/blob/main/README_CNSCHEMA_CN.md, 如果超出范围内的您可以使用标注的训练语料按文档说明训练自定义的模型。