InternVL icon indicating copy to clipboard operation
InternVL copied to clipboard

[Feature] MPO for other mllms

Open jumbo-q opened this issue 10 months ago • 2 comments

Motivation

根据结构来看好像是用dpo脚本训练internVL的MPO 请问如果是QwenVL的模型是不是不支持 有没有什么方法迁移过去

Related resources

No response

Additional context

No response

jumbo-q avatar Feb 25 '25 08:02 jumbo-q

请问你在使用mpo脚本训练的时候,遇到使用自己数据集训练的loss始终为0的情况吗

amoreZgx1n avatar Feb 28 '25 08:02 amoreZgx1n

没有 倒是经常过拟合

jumbo-q avatar Mar 13 '25 06:03 jumbo-q

same problem.

HuaYuexia avatar Jul 10 '25 11:07 HuaYuexia