K-BERT icon indicating copy to clipboard operation
K-BERT copied to clipboard

About Knowgraph.py

Open luojy25 opened this issue 4 years ago • 3 comments

您好,请问Knowgraph.py中add_knowledge_with_vm函数通过pkseg分词得到的是每个字而不是单词,而brain知识图谱中的实体都是词组,这样不是匹配不上吗?

如: ['[CLS]两小时读完'] [['[CLS]', '两', '小', '时', '读', '完', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', ...

luojy25 avatar Apr 01 '20 18:04 luojy25

您好,请问Knowgraph.py中add_knowledge_with_vm函数通过pkseg分词得到的是每个字而不是单词,而brain知识图谱中的实体都是词组,这样不是匹配不上吗?

如: ['[CLS]两小时读完'] [['[CLS]', '两', '小', '时', '读', '完', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', ...

您好,add_knowledge_with_vm里用的是pkuseg,是一个分词工具,是按词分的。

autoliuweijie avatar Apr 02 '20 02:04 autoliuweijie

您好,请问Knowgraph.py中add_knowledge_with_vm函数通过pkseg分词得到的是每个字而不是单词,而brain知识图谱中的实体都是词组,这样不是匹配不上吗? 如: ['[CLS]两小时读完'] [['[CLS]', '两', '小', '时', '读', '完', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', ...

您好,add_knowledge_with_vm里用的是pkuseg,是一个分词工具,是按词分的。

代码中确实是用了pkuseg分词,词典也是根据knowledge Graph构建的,但上面也确实是我按照Readme文件说明在原代码的基础上print出来的结果,请问可能是哪里出问题了呢?

luojy25 avatar Apr 02 '20 04:04 luojy25

您好,请问Knowgraph.py中add_knowledge_with_vm函数通过pkseg分词得到的是每个字而不是单词,而brain知识图谱中的实体都是词组,这样不是匹配不上吗? 如: ['[CLS]两小时读完'] [['[CLS]', '两', '小', '时', '读', '完', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', '[PAD]', ...

您好,add_knowledge_with_vm里用的是pkuseg,是一个分词工具,是按词分的。

代码中确实是用了pkuseg分词,词典也是根据knowledge Graph构建的,但上面也确实是我按照Readme文件说明在原代码的基础上print出来的结果,请问可能是哪里出问题了呢?

你可以试试一些包含实体词的句子。

autoliuweijie avatar Apr 03 '20 15:04 autoliuweijie