insuranceqa-corpus-zh
insuranceqa-corpus-zh copied to clipboard
求解答pair数据集的疑惑,谢谢
您好: 请问能详细说明一下项目insuranceqa-corpus-zh中corpus目录下iqa.train.tokenlized.pair.json文件中的数值的对应关系吗?特别是“question”字段不清楚如何对应到原文本?
由于近期实验需要参考您这份数据集,还望您能尽快回复,谢谢。
就我的推理来看,question对应的值是一个列表,列表内容为一个个数字,根据数字,使用vocab_data下id2word来找到对应的词,从而还原出具体的question