Jia-Chen Gu comments

Results 8 comments of


                                            Jia-Chen Gu

请教几个有关豆瓣数据集的问题

@andrew-begain 1.正例是正常连续的对话，将最后一句当作正例回复，之前的当作对话历史；负例是从整个语料库中随机采样。具体可参考https://arxiv.org/pdf/1612.01627.pdf 2. 我们没有重新进行负采样，正负样例follow了原始数据集，只不过加了id信息。NA表示没有正确回复，这是Douban测试集的特性 3. 我们仅仅是对原始的数据集进行了加id操作，没有筛选，你可以联系原作者 https://github.com/MarkWuNLP/MultiTurnResponseSelection

请教几个有关豆瓣数据集的问题

@andrew-begain 关于如何制作一个好的数据集，你可以参考现有常用的数据集的论文，例如Ubuntu (https://aclanthology.org/W15-4640.pdf), Douban(https://arxiv.org/pdf/1612.01627.pdf), E-commerce(https://aclanthology.org/C18-1317.pdf) 也可参考我们维护的一个leaderboard(https://github.com/JasonForJoy/Leaderboards-for-Multi-Turn-Response-Selection) 如何召回一些好的回复，可以用一些轻量级的IR算法，例如TF-IDF和BM25，一些计算量比较大但更准确的，例如DPR

Jia-Chen Gu

请教几个有关豆瓣数据集的问题

请教几个有关豆瓣数据集的问题

No requirements.txt file

Hardware specifications for IMN model

Hardware specifications for IMN model

Hardware specifications for IMN model

Hardware specifications for IMN model

pytorch checkpoint