ChatGLM-Efficient-Tuning
ChatGLM-Efficient-Tuning copied to clipboard
RM 训练完成后rm文件夹下没有权重文件
在ppo训练时 要选择checkpoint 里边的,怎么确定是最优的呢?
脚本没有运行完吧? 选择最优的可以用 --do_eval 来进行测试
脚本运行完了,我在检查一下
重新运行后,发现中间过程内存溢出,停止了,更改参数后,问题解决