Zhengxiao Du

https://duzx16.github.io/ [email protected]

Tsinghua University

Results 163 comments of


                                            Zhengxiao Du

请问如何对chatglm-6b模型进行微调

Already supported in https://github.com/THUDM/ChatGLM-6B/tree/main/ptuning

[BUG/Help] 用P-Tuning v2微调之后进行推理发现是乱码？

你微调的时候只用了单轮数据的话模型只有单轮的回复是经过了微调的。也就是说应该设置 `history=[]`。不过即使是有history的情况这个输出也过于奇怪了。你evaluate的结果跟仓库里是一致的

是否只支持英伟达的显卡

能够运行PyTorch的都可以

【求助】两个节点多卡运行ds_train_finetune.sh遇到tcp超时问题

可能是机器有防火墙屏蔽了 22 以外的端口

[BUG/Help] 网页ws里有报错信息，不展示返回的数据

请提供报错截图和你的环境信息

[Help] 如何支持多显卡

@jeffsjf 请使用 https://github.com/THUDM/ChatGLM-6B#%E5%A4%9A%E5%8D%A1%E9%83%A8%E7%BD%B2

[BUG/Help] <run web_demo.py on server>

I think you should replace `compute3` with `127.0.0.1`

[Help] 为什么P-tuning v2 示例参数的step是3000？

因为 3000 步的训练在这个数据集上已经能取得不错的效果。针对自己的数据集可以进行调整。

[Help] 为什么P-tuning v2 示例参数的step是3000？

因为 3000 步的训练在这个数据集上已经能取得不错的效果。针对自己的数据集可以进行调整。

RuntimeError: Internal: src/sentencepiece_processor.cc(1101) [model_proto->ParseFromArray(serialized.data(), serialized.size())]

`ice_text.model` 文件下载不正确，可以跟 https://huggingface.co/THUDM/chatglm-6b/blob/main/ice_text.model 对比一下

‹
1
2
3
4
5
6
7
8
9
10
...
16
17
›