TonyUSTC issues

Results 5 issues of


                                            TonyUSTC

[Question] model_base：llava-v1.5-13b or vicuna-13b-v1.5?

### Question When using Lora weights for inference, should the model_base be chosen as llava-v1.5-13b or vicuna-13b-v1.5? What are the differences between them?

bug：多卡同步的时候，cross_targets计算方式是不是有问题？

代码第265行，多卡数据同步之后，cross_targets计算方式有问题，应该得考虑当前local rank。 https://github.com/FlagOpen/FlagEmbedding/blob/97f57a1b92dc68d56731a1e38a2d3aad4cd67e20/FlagEmbedding/BGE_M3/modeling.py#L265 原始是：cross_targets = idxs_cross * (cross_p_dense_vecs.size(0) // cross_q_dense_vecs.size(0)) 应该是：cross_targets = idxs_cross * (cross_p_dense_vecs.size(0) // cross_q_dense_vecs.size(0))+self.process_rank*p_dense_vecs.size(0)

TonyUSTC

[Question] model_base：llava-v1.5-13b or vicuna-13b-v1.5?

bug：多卡同步的时候，cross_targets计算方式是不是有问题？

多卡load模型OOM

[Bug]: initializing multiple LLM classes simultaneously on the same GPU get an error

qlora微调qwen2.5-32B报错