ChatGLM-Efficient-Tuning
ChatGLM-Efficient-Tuning copied to clipboard
reward模型,怎么加载本地模型呀?
reward模型,怎么加载本地模型呀?
现阶段的 reward model 只能加载 LoRA 权重