Chinese_KGQA icon indicating copy to clipboard operation
Chinese_KGQA copied to clipboard

该仓库目的是实现基于知识图谱的中文问答系统

Chinese_KGQA

该仓库目的是收集、整理基于知识图谱的中文问答系统的相关研究工作,实现一个基于知识图谱的中文问答系统

  • code文件夹下存放问答模型,每一个模型是一个文件夹,用模型的名称命名
  • data文件夹下存放问答数据集
  • kg文件夹下存放知识图谱
  • png文件夹下存放所需要的图片
  • result文件夹下记录code文件夹下的每一个模型在data文件夹下的每一个数据集上的实验结果
  • notebook文件夹下存放问答模型,每一个模型是一个文件夹,用模型的名称命名。与code文件夹不同的是notebook文件夹下的代码以notebook展示,尽可能的展示问答模型的细节
  • kgclue文件夹存放KgCLUE评测榜的代码和实验记录

kgclue文件夹

KgCLUE是一个大规模中文开源知识图谱问答项目,提供了评测榜

该文件夹下的子文件夹以实验模型的名称命名,对应的README文件介绍了每一个实验模型以及评测分数

code文件夹

该文件夹下的子文件夹都是以模型名称命名,目前包括:

data文件夹

该文件夹下的子文件夹都是以QA数据集名称命名,目前包括:

  • WebQSP
  • nlpcc2018(官网:http://tcci.ccf.org.cn/conference/2018/taskdata.php,选择task7,Open Domain Question Answering,即可下载数据集。数据集包含知识图谱和问答数据)

kg文件夹

该文件夹下的子文件是以知识图谱的名称命名,目前包括:

  • fbwq_full(来源https://drive.google.com/file/d/1uWaavrpKKllVSQ73TTuLWPc4aqVvrkpx/view?usp=sharing,也就是Embed-KGQA给出的整理好的知识图谱)
  • nlpcc2018(来源就是官网http://tcci.ccf.org.cn/conference/2018/taskdata.php中下载的知识图谱)
  • PKU(北大的中文百科知识图谱。链接:https://pan.baidu.com/s/1Br8eU60t2fV4crtC2HOlSg 提取码:tvv1)

相关工作和资源总结

博客

  1. 开放知识图谱

GitHub链接

关于KGE

链接 说明 备注
https://github.com/uma-pi1/kge/ 专门用于KGE的仓库,实现了诸多KGE模型 代码看的有点懵
https://github.com/Sujit-O/pykg2vec 另一个专门用于KGE的仓库,实现了诸多KGE模型 目前还不清楚和上个kge仓库哪个好用
https://github.com/facebookresearch/PyTorch-BigGraph 专门针对超大规模知识图谱嵌入、存储以及应用的仓库
https://github.com/facebookresearch/kbc BigGraph中的一个子模块,专门实现了ComplEx模型 代码量简洁,很方便的实现ComplEx模型在FB15k和其他数据集的实验

关于KGQA

链接 说明 备注
https://github.com/malllabiisc/EmbedKGQA/ ACL2020论文EmbedKGQA的源码
https://github.com/shijx12/TransferNet EMNLP2021论文TransferNet的源码

其它

链接 说明 备注
https://github.com/BDBC-KG-NLP/QA-Survey 北航某个团队的项目,对问答系统的总结,包括各种任务问答(文本、图谱等)。 总结的相当全面,包括学术界和工业界
https://github.com/liuhuanyong/QAonMilitaryKG 360某个NLP专家的代码,军事领域知识图谱问答系统。 这个专家的GitHub仓库很多都是关于知识图谱的
https://github.com/BshoterJ/awesome-kgqa 该仓库主要记录了关于KGQA的一些资源,包括论文、比赛等

论文

综述

KGQA

KGE

中文开放域知识图谱

  • PKU(北大的中文百科知识图谱。链接:https://pan.baidu.com/s/1Br8eU60t2fV4crtC2HOlSg 提取码:tvv1)
  • nlpcc2018(官网:http://tcci.ccf.org.cn/conference/2018/taskdata.php 选择task7 Open Domain Question Answering,即可下载数据集。数据集包含知识图谱和问答数据)
  • 思知知识图谱(地址:https://www.ownthink.com/docs/kg/)
  • KgCLUE(地址:https://github.com/CLUEbenchmark/KgCLUE)

这四个是比较大的开放域知识图谱,此外还有一些垂类领域如军事、医学、法律等领域的知识图谱,这里不再介绍。

中文问答数据(基于开放域知识图谱)

  • ccks(https://github.com/pkumod/CKBQA/tree/master/data)
  • nlpcc2018 (官网:http://tcci.ccf.org.cn/conference/2018/taskdata.php 选择task7 Open Domain Question Answering,即可下载数据集。数据集包含知识图谱和问答数据)
  • KgCLUE(地址:https://github.com/CLUEbenchmark/KgCLUE)

个人总结的博客

尽量按照所列顺序阅读

  1. 简要总结一篇知识图谱嵌入综述
  2. 简单实现几篇知识图谱嵌入(Knowledge Graph Embedding,KGE)模型
  3. KGQA概览
  4. EmbedKGQA论文简要解读