wintercat1994

Results 11 comments of wintercat1994

> 你好, > > 如果已经有明确的正确答案,可以通过MPO论文中ground truth的管线。你采用的领域数据是否试验过其他开源模型的回复正确率?如果正确率可以的话,我认为,或许可以通过先借助其他模型初步训练你的1b模型的CoT能力。 感谢您的回复,我的领域数据在其他开源模型上回复正确率较低,之前担心1b模型cot能力较差,带来反效果,因此没有做相关训练。我会尝试一下!