AdaLoGN
AdaLoGN copied to clipboard
AdaLoGN: Adaptive Logic Graph Network for Reasoning-Based Machine Reading Comprehension (ACL 2022)
Hi authors, Could you please tell me which mode that you used (server/cli) and how can i create FLAT files like you. Thanks for you support.
您好,可以给出您使用Graphene提取工具的graphene-core / graphene-server / graphene-cli中哪个模式和使用的命令吗?
作者您好,复现该项目代码之后,有两个疑问。 第一,我使用了您在谷歌云盘上传的checkpoint对两个数据集进行了验证。其中,LogiQA的验证集和测试集、Reclor的验证集结果基本符合您的论文数据。对Reclor的测试集,我给test.json补充了标签,得到的测试结果是74.4%,远高于论文数据。 第二,我尝试在3块RTX8000上从头开始训练模型,参数和原代码中的一致。但是训练后模型在验证集与测试集上的正确率远低于预期,似乎loss也没有收敛。请问参数需要更改吗? 祝您新年快乐,工作顺利!
我不是很懂,因为课程原因想运行一下您的代码 在服务器上运行时好像单个显卡运行时显存不够(11G显存),想修改batch size,在shell里面将两个batch size都修改为了1还是跑不动。 用两块以上的显卡一起跑的时候会有RuntimeError: NCCL Error 2: unhandled system error报错,不知怎么解决,万分感谢!!
reclor数据集没有测试集的标签,请问如何论文中reclor的test-acc如何计算得出
你好~ 我在尝试运行eva的时候,出现以下错误: RuntimeError: Error(s) in loading state_dict for Tagger: size mismatch for drop_replacement: copying a param with shape torch.Size([2248]) from checkpoint, the shape in current model is torch.Size([325]). 希望能得到解答,谢谢~
transformers==4.5.0 module transformers has no attribute TFRobertaAdaLoGN which version?