UniRE icon indicating copy to clipboard operation
UniRE copied to clipboard

关于数据处理

Open nlper01 opened this issue 2 years ago • 4 comments

ACE05数据拿来后要咋处理?处理成啥格式?可以提供一份处理后的样例看看嘛? 图片

nlper01 avatar Aug 01 '22 04:08 nlper01

  1. 首先使用 https://github.com/LorrinWWW/two-are-better-than-one/tree/master/datasets#ace-2005 提供的脚本处理ACE05的原始数据,注意只需要执行前三行命令,执行到zsh run.zsh即可,此时可以得到一个ace2005文件夹
  2. 然后再使用本repo提供的脚本 https://github.com/Receiling/UniRE/tree/master/data#dataset-processing 处理成最终格式,即执行./ace2005.sh ace2005,此时可以得到最终数据ACE2005文件夹

Receiling avatar Aug 11 '22 15:08 Receiling

ACE05数据拿来后要咋处理?处理成啥格式?可以提供一份处理后的样例看看嘛? 图片

请问从哪里获取的ACE05数据,方便告知吗

Bwin-AI avatar Oct 11 '22 05:10 Bwin-AI

本repo数据处理部分介绍了所使用的的三个数据集的地址,详见https://github.com/Receiling/UniRE/tree/master/data#dataset-processing

ACE2005的下载地址是https://catalog.ldc.upenn.edu/LDC2006T06

Receiling avatar Oct 13 '22 06:10 Receiling

2. 然后再使用本repo提供的脚本 https://github.com/Receiling/UniRE/tree/master/data#dataset-processing 处理成最终格式,即执行./ace2005.sh ace2005,此时可以得到最终数据ACE2005文件夹

你好,我用这个方法: 首先使用 https://github.com/LorrinWWW/two-are-better-than-one/tree/master/datasets#ace-2005 提供的脚本处理ACE05的原始数据,注意只需要执行前三行命令,执行到zsh run.zsh即可,此时可以得到一个ace2005文件夹 得到ace2005数据之后,使用./ace2005.sh ace2005指令,报错找不到test.json b30f7d83a9532cc4a0a9cd5b0420f1b

Bwin-AI avatar Oct 15 '22 09:10 Bwin-AI

从报错日志上看,当前目录下没有train.json、dev.json、test.json三个数据文件, 可以先确认下 https://github.com/LorrinWWW/two-are-better-than-one/tree/master/datasets#ace-2005 下的脚本是否成功执行,并且在ace2005文件夹下生成了train.json、dev.json、test.json 三个数据文件。

Receiling avatar Oct 23 '22 11:10 Receiling