ChatGLM-6B
ChatGLM-6B copied to clipboard
[BUG/Help]如何对chatglm-6b进行RLHF,有相关的代码实现吗?
Is there an existing issue for this?
- [X] I have searched the existing issues
Current Behavior
没找到相关的实现代码
Expected Behavior
No response
Steps To Reproduce
None.
Environment
OS: Ubuntu 20.04
Python: 3.8
Transformers: 4.26.1
PyTorch: 1.12
CUDA Support: True
Anything else?
No response
同问 可以出一个教程吗
同问
参考trl和trlx这两个项目,GPT2+PPO 、GPT2+ILQL
微软的deepspeed-chat,改改代码应该可以支持吧
同问
参考trl和trlx这两个项目,GPT2+PPO 、GPT2+ILQL
你试过可行吗
Duplicate of #3