JOHNNY-fans

Results 4 issues of JOHNNY-fans

您好,看到论文中提到了数据全开源,请问一下RetroMAE预训练用到的105种语言的语料该如何申请或者下载。

四卡40gH卡,batch开32,开了gradient_checkpointing,query_max_len 512 ,passage_max_len 8192 训着训着会突然OOM,求问稳定的解决方案,(尝试了batch开4,16,32都会炸)

求问大佬的实现版本是否支持torch2,以及最新的transformer版本