PaddleMIX
PaddleMIX copied to clipboard
sft训练需要合并权重吗?
是不需要的,例如llava sft训练vision encoder部分参数不更新,训练时不会保存vision encoder部分,而推理阶段会自动加载这部分参数