FlagEmbedding icon indicating copy to clipboard operation
FlagEmbedding copied to clipboard

BGE-M3复现评估结果疑问

Open WangCC-77 opened this issue 1 year ago • 4 comments

作者,你好,非常感谢你们能够开源这么棒的模型,目前我在自己的服务器上对BGE-M3进行复现,目前仅复现了微调阶段,使用的基座模型是bge-m3-unsupervised,执行命令是:

torchrun --nproc_per_node 8 {WORK_DIR}/run.py  \
                --output_dir /cache/output \
                --model_name_or_path {WORK_DIR}/preModel/bge-m3-unsupervised \
                --train_data /cache \
                --learning_rate 1e-5 \
                --fp16 \
                --cache_path {WORK_DIR}/cache_path/ \
                --gradient_checkpointing True \
                --gradient_accumulation_steps=54 \
                --dataloader_pin_memory=True \
                --dataloader_num_workers=4 \
                --deepspeed {WORK_DIR}/ds_config_zero2.json \
                --use_reentrant False \
                --num_train_epochs 5 \
                --per_device_train_batch_size 2 \
                --dataloader_drop_last True \
                --normlized True \
                --temperature 0.02 \
                --query_max_len 512 \
                --passage_max_len 7131 \
                --train_group_size 8 \
                --negatives_cross_device \
                --logging_steps 10 \
                --same_task_within_batch True \
                --unified_finetuning True \
                --use_self_distill True \
                --enable_modelarts True \
                --train_url {args.train_url} \
                --data_url {args.data_url}

最后,我对得到的模型进行评估,目前是在mldr数据集的ar语言上进行评估: 首先是dense检索,得到的结果是nDCG@10:41.38,论文中是47.65,相差6个点以上; 然后是sparse检索,得到的结果是nDCG@10:0.0,就很奇怪呀,怎么会出现0.0这个结果呀,我在测试之前对你们给出的bge-m3模型进行过评估,与论文基本一致,说明我的环境是没问题的,但是在评估我自己复现的模型时,就出现这样0.0这样的结果了,麻烦作者帮忙看看,是不是我的训练参数设置的有问题呢?

WangCC-77 avatar Dec 16 '24 06:12 WangCC-77

@WangCC-77 你好,请问一下你在测试mldr数据集的英文数据规模大概多少,是什么机器配置呢,用的什么卡,能不能透露一下,我也在使用?

JackTan25 avatar Dec 18 '24 11:12 JackTan25

@WangCC-77 你好,请问一下你在测试mldr数据集的英文数据规模大概多少,是什么机器配置呢,用的什么卡,能不能透露一下,我也在使用?

我这边目前还没对en语言进行测试,目前只在ar语言上进行了测试;所用的显卡是3090,测试的时候只用了一张卡,我后面也测试一下en语言,有结果再给你留言。

WangCC-77 avatar Dec 19 '24 01:12 WangCC-77

@WangCC-77 你好我这边遇到问题,请问可否加一下联系方式进行交流呢? 这是我的微信id: wxid_31t2juc4mhyk22,谢谢

JackTan25 avatar Dec 23 '24 07:12 JackTan25

I have the same problem. Did u find any solution for it ?

tenafrangelos avatar Feb 13 '25 09:02 tenafrangelos