FlagEmbedding icon indicating copy to clipboard operation
FlagEmbedding copied to clipboard

有监督微调训练报错问题

Open LLLiHaotian opened this issue 1 year ago • 1 comments

麻烦您帮我看一下,为什么在微调bge-m3的时候会出现如此报错。 之前在没有query数量为1、pos数量为1、neg数量为10的时候为微调训练正常进行;目前调整为query数量为1、pos数量为11、neg数量为10,却有报错信息,我查看了train_data,发现没有什么问题。

微调训练命令如下 nohup
torchrun --nproc_per_node 2
-m FlagEmbedding.baai_general_embedding.finetune.run
--output_dir /bgem3/supervised_simcse_fine-tune
--model_name_or_path /bgem3
--train_data query_pos_neg_data.jsonl
--learning_rate 1e-5
--fp16
--num_train_epochs 200
--per_device_train_batch_size 256
--dataloader_drop_last False
--normlized True
--temperature 0.02
--query_max_len 350
--passage_max_len 350
--train_group_size 22
--negatives_cross_device
--logging_steps 100
--save_steps 1000
--query_instruction_for_retrieval "" \

fine_tune.log 2>&1 &

日志内容如下 log.txt

LLLiHaotian avatar Apr 27 '24 05:04 LLLiHaotian

数据格式的问题,看起来是有些pos不是字符串类型 image

staoxiao avatar Apr 27 '24 17:04 staoxiao