InternVL
InternVL copied to clipboard
[Feature] MPO for other mllms
Motivation
根据结构来看好像是用dpo脚本训练internVL的MPO 请问如果是QwenVL的模型是不是不支持 有没有什么方法迁移过去
Related resources
No response
Additional context
No response
请问你在使用mpo脚本训练的时候,遇到使用自己数据集训练的loss始终为0的情况吗
没有 倒是经常过拟合
same problem.