TensorFlow_RLRE icon indicating copy to clipboard operation
TensorFlow_RLRE copied to clipboard

数据集问题

Open young-nlp opened this issue 6 years ago • 2 comments

想问一下关于数据集的问题,这个数据集处理后得到的train有577088个句子,但论文里提到的是522611个句子,这是因为原本的数据集的train和test有部分的entity pair重复了。PCNN+ATT这篇论文过滤处理后得到是522611个句子的规模。但在Feng的源代码和您这个代码好像都是直接使用未过滤的。

young-nlp avatar Nov 05 '18 03:11 young-nlp

嗯嗯,确实是这样,没有进行过滤。会有一部分entity pair是重复的。

xuyanfu avatar Nov 05 '18 06:11 xuyanfu

您好,我想问下,为啥我下了之后,origin_data里的train.txt里没有数据,只有一个软件下载的网址,我想问下,我该如何找到训练数据集呢

zwd13122889 avatar Dec 15 '20 11:12 zwd13122889