MedicalGPT icon indicating copy to clipboard operation
MedicalGPT copied to clipboard

ChatGLM是不是无法做RM和RL的训练?

Open Leekinxun opened this issue 11 months ago • 8 comments

Describe the Question

Please provide a clear and concise description of what the question is. chatglm2是不是做不了PPO相关的训练,我在rm模型中用了bert训练,但是无法合并参数,同时第四部的rl训练也显示ChatGLM2模型没有AutoModelForCausalLMWithValueHead,请问这种情况是不是只能换模型了

Leekinxun avatar Jul 21 '23 09:07 Leekinxun