insuranceqa-corpus-zh icon indicating copy to clipboard operation
insuranceqa-corpus-zh copied to clipboard

求解答pair数据集的疑惑,谢谢

Open digfound opened this issue 6 years ago • 1 comments

您好: 请问能详细说明一下项目insuranceqa-corpus-zh中corpus目录下iqa.train.tokenlized.pair.json文件中的数值的对应关系吗?特别是“question”字段不清楚如何对应到原文本?

    由于近期实验需要参考您这份数据集,还望您能尽快回复,谢谢。

digfound avatar Oct 26 '18 13:10 digfound

就我的推理来看,question对应的值是一个列表,列表内容为一个个数字,根据数字,使用vocab_data下id2word来找到对应的词,从而还原出具体的question

quantum00549 avatar Jul 03 '19 03:07 quantum00549