zxm8601

Results 10 comments of zxm8601

> 你试试 7b 的 baichuan 模型单机多卡能跑通吗 试过了,也会报这个错

> 我明天过去排查一下 在 2023-12-03 20:25:10,"zxm8601" ***@***.***> 写道: 你试试 7b 的 baichuan 模型单机多卡能跑通吗 试过了,也会报这个错 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because...

> 你设置 gradient_checkpointing 为 True 了吗 请问在哪里设置

> 你在训练的 sh 文件里添加一行参数试试: --ddp_find_unused_parameters True 好的,我试试

![image](https://github.com/zejunwang1/LLMTuner/assets/152397003/7cf882a2-7c0f-4501-ae04-43b115dd1440) 出现了新的错误

单卡显存会爆,不好意思,github突然打不开了,在这里回复 阿鹤 ***@***.***   ------------------ 原始邮件 ------------------ 发件人: "zejunwang1/LLMTuner" ***@***.***>; 发送时间: 2023年12月3日(星期天) 晚上9:52 ***@***.***>; ***@***.******@***.***>; 主题: Re: [zejunwang1/LLMTuner] qlora单机多卡微调baichuan2-13b问题 (Issue #6) 你单卡训练正常吗 — Reply to this email directly, view it on GitHub, or unsubscribe....

> 你显卡的显存多大 在 2023-12-03 21:58:12,"zxm8601" ***@***.***> 写道: 单卡显存会爆,不好意思,github突然打不开了,在这里回复 阿鹤 ***@***.***   > […](#) > ------------------ 原始邮件 ------------------ 发件人: "zejunwang1/LLMTuner" ***@***.***>; 发送时间: 2023年12月3日(星期天) 晚上9:52 ***@***.***>; ***@***.******@***.***>; 主题: Re: [zejunwang1/LLMTuner] qlora单机多卡微调baichuan2-13b问题 (Issue #6) 你单卡训练正常吗 — Reply...

在训练命令中加入是指这样子吗 ![image](https://github.com/zejunwang1/LLMTuner/assets/152397003/8ef7a023-006e-4ed4-b419-56860def69d3)

> 是的,设置 --ddp_find_unused_parameters False 好的,我试一下

解决了,可以跑起来,感谢!