LSR icon indicating copy to clipboard operation
LSR copied to clipboard

ACL2020论文的疑惑

Open Helen-Hang opened this issue 3 years ago • 6 comments

作者您好,有三个问题想请教您: 请问您table2上备注的结果是不是只考虑了人工标注的场景,没有在远程监督的场景下进行实验? 您的前四个baseline跟Yao的无论哪一种设置的实验结果有点不一样,是不是自己复现的结果? 论文中没有考虑到AUC评估吗?

Helen-Hang avatar Jul 14 '20 10:07 Helen-Hang

@Helen-Hang 谢谢关注提问。 Q1:请问您table2上备注的结果是不是只考虑了人工标注的场景,没有在远程监督的场景下进行实验? A1: 我们没有使用远程监督数据集,因为太大,训练起来非常慢。

Q1: 您的前四个baseline跟Yao的无论哪一种设置的实验结果有点不一样,是不是自己复现的结果? A1: IgnF1和F1我们直接使用的是Yao论文中的结果,我们也复现了,结果非常接近。由于Yao的Paper中没有Intra-F1和inter-F1,所以我们参考https://www.aclweb.org/anthology/D19-1498.pdf的设置计算出来Intra-F1和inter-F1

Q1:论文中没有考虑到AUC评估吗? A1: 没有

nanguoshun avatar Jul 17 '20 13:07 nanguoshun

image image 我看无论是Dev还是Test都不一样,楼主论文中的结果应该是自己复现的结果把!

Helen-Hang avatar Jul 19 '20 12:07 Helen-Hang

@Helen-Hang 我们复现的dev/test的F1跟Yao的很接近。IgnF1有些不同,我们当时复现的结果应该是比Yao的高一些,可能需要重新跑一下要的代码确认。

nanguoshun avatar Jul 19 '20 13:07 nanguoshun

@Helen-Hang 你好,谢谢提问关注。我重新运行了 https://github.com/thunlp/DocRED 中的BiLSTM,从复现结果可以看出无论F1和IgnF1跟我们paper中Table2的数据很接近,其中F1跟Yao的基本一致,我们复现的IgnF1比Yao的要高很多。

基本环境 ubuntu16.04/Pytorch 1.5.1/CUDA10.1/Python3.6

| step 1 | time: 66.82 total_recall 12323 ALL : Theta 0.3516 | F1 0.5025 | AUC 0.4856 Ignore ma_f1 0.4820 | input_theta 0.3516 test_result F1 0.4812 | AUC 0.4576 | epoch 29 | time: 197.11s

nanguoshun avatar Jul 20 '20 02:07 nanguoshun

https://github.com/thunlp/DocRED/issues/47

@Helen-Hang 这个应该就是原因,DocRED原作者他们去年8月9日才更新正确的效果,所以aclweb上DocRED的paper可能是旧版的效果

DreamInvoker avatar Aug 29 '20 04:08 DreamInvoker

@nanguoshun 作者您好,我在thunlp/DocRED#47中也提到了ignore计算的问题,能否麻烦你们确认一下你们的逻辑,并更新至你们代码和arxiv,因为我们最近做实验发现你们ignore的效果好像挺低的

DreamInvoker avatar Aug 29 '20 04:08 DreamInvoker