Wang Yijun

Results 6 comments of Wang Yijun

1. 首先使用 https://github.com/LorrinWWW/two-are-better-than-one/tree/master/datasets#ace-2005 提供的脚本处理ACE05的原始数据,注意只需要执行前三行命令,执行到`zsh run.zsh`即可,此时可以得到一个ace2005文件夹 2. 然后再使用本repo提供的脚本 https://github.com/Receiling/UniRE/tree/master/data#dataset-processing 处理成最终格式,即执行`./ace2005.sh ace2005`,此时可以得到最终数据ACE2005文件夹

本repo数据处理部分介绍了所使用的的三个数据集的地址,详见https://github.com/Receiling/UniRE/tree/master/data#dataset-processing ACE2005的下载地址是https://catalog.ldc.upenn.edu/LDC2006T06

从报错日志上看,当前目录下没有train.json、dev.json、test.json三个数据文件, 可以先确认下 https://github.com/LorrinWWW/two-are-better-than-one/tree/master/datasets#ace-2005 下的脚本是否成功执行,并且在ace2005文件夹下生成了train.json、dev.json、test.json 三个数据文件。

@pavanimajety Dose this PR support nvidia/DeepSeek-R1-FP4 Model inference on Hopper architecture?

@pavanimajety Yes, I have set `use_marlin` flag, but encountered an error: AttributeError: '_OpNamespace' '_moe_C' object has no attribute 'moe_align_block_size'. Could you provide the run command on 8*H100 or 8*H20?