dongdongrj
dongdongrj
你好,我用你这个demo测试水印的二维码图片,因为图片有反光,很难扫描出来(特别是晚上开灯),但是用微信、qq很快就能扫出来,请问如何优化算法?
### Is there an existing issue for this? - [X] I have searched the existing issues ### Current Behavior 运行web_demo.py时每次都在加载模型文件时,进度到62%中断了。 Loading checkpoint shards: 62% 5/8 [00:43
### Is your feature request related to a problem? Please describe. _No response_ ### Solutions 请问这个模型支持代码的生成和检查bug吗? ### Additional context _No response_
没有看到RLHF的代码
你好,下载repo后,在modeling_chatglm.py中没有看到RLHF和训练RM及PPO训练RL的代码。在read_me中明明说是和chatGPT一样的技术,支持RLHF的,请问是怎么情况啊。
看到在infer.ipynb中有如下两处代码 1、model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, load_in_8bit=True, device_map=' 2、model = PeftModel.from_pretrained(model, "./output/") 请问,第一次调用是加载了原始的model,第二次调用时是加载了微调后的model的什么参数?第二次调用是将微调后的参数更新了原始的model吗?
请问这些微调模型都是通过SFT微调得来的吗?关于RM和PPO阶段的微调,是没有用到呢?还是没有开源呢? 如果是没有用到RLHF,仅仅只是通过SFT就可以达到不错的效果,说明问答数据集是非常充分的。对于特定领域, 这可能不太可行。