dongdongrj comments

Results 21 comments of


                                            dongdongrj

Does this code set the learning rate？when i use my own dataset，the loss becomes nan and i want to decrease the learning-rate but i cant find it

Change the LR by below code: K.set_value(model.optimizer.lr, 0.0001)

[BUG/Help] <title>请问目前输入最大支持多少字符？对应需要多少显存，另外内存共享给GPU的内存可以被调用吗？

> 请问有啥推荐的模型吗？请问有好的模型推荐吗

运行python web_demo.py报错

> 应该是内存不足，可以尝试使用INT4量化的模型 https://huggingface.co/THUDM/chatglm-6b-int4 谢谢。

运行python web_demo.py报错

> > 应该是内存不足，可以尝试使用INT4量化的模型 https://huggingface.co/THUDM/chatglm-6b-int4 > > 谢谢，用int4确实可以。如果把模型文件下载到硬盘，会不会好点。我之前直接跑infer是可以的。infer是把模型下载下来的。

既然使用 alpaca 数据集来微调的话，为什么不使用 llama呢？我看测试的例子也是在英文的基础上，如果本来就是要做英文的任务，llama + alpaca 不应该比 chatGLM + alpaca 更好吗？

> 英文任务LLaMA比chatglm效果好很多 > > 这里用alpaca只是例子，如果要做中文的增强，也可以用类似belle等中文数据集进行SFT，方法是一样的做代码的增强，有什么好的数据集吗

> 训练 Reward Model 需要执行 SeqCLS 这个Task： huggingface 的 transformer 提供 "AutoModelForSequenceClassification" 这个类。但是 ChatGLM 只有 "ChatGLMForConditionalGeneration" 这个类。所以暂时没法训练 Reward model，等ChatGLM自己放出代码，或者huggingface 集成 ChatGLM吧我就是想看看，是如何训练RM及如何用RM再训练RL的。大量的无标签的数据格式是怎么样的，这个你知道吗。

没有看到RLHF的代码

> > 训练 Reward Model 需要执行 SeqCLS 这个Task： huggingface 的 transformer 提供 "AutoModelForSequenceClassification" 这个类。但是 ChatGLM 只有 "ChatGLMForConditionalGeneration" 这个类。所以暂时没法训练 Reward model，等ChatGLM自己放出代码，或者huggingface 集成 ChatGLM吧 > > transformers似乎没有计划支持chatglm，所以直接用trl去rlhf不太现实你说的trl是什么？迁移学习吗