MedicalGPT
MedicalGPT copied to clipboard
ChatGLM是不是无法做RM和RL的训练?
Describe the Question
Please provide a clear and concise description of what the question is. chatglm2是不是做不了PPO相关的训练,我在rm模型中用了bert训练,但是无法合并参数,同时第四部的rl训练也显示ChatGLM2模型没有AutoModelForCausalLMWithValueHead,请问这种情况是不是只能换模型了