Qwen icon indicating copy to clipboard operation
Qwen copied to clipboard

请问lora微调72Bqwen需要多大内存,A800服务器

Open uloveqian2021 opened this issue 1 year ago • 6 comments

如题,希望大佬 告知,目前8卡A800上跑不起来

uloveqian2021 avatar Dec 01 '23 13:12 uloveqian2021

同问,8卡A800 + LoRA base-model搞不出来,用的zero2,zero3+lora存在问题,可以交流一下 2 * 8卡A800多机载入72B在转成bf16时爆了内存(内存1T)?很奇怪

Luobots avatar Dec 03 '23 03:12 Luobots

我4卡a800 加zero3可以,就是loss70轮都掉到0了奇怪,也不生效

88489754 avatar Dec 05 '23 10:12 88489754

我4卡a800 加zero3可以,就是loss70轮都掉到0了奇怪,也不生效

请问您这边服务器内存是多大

uloveqian2021 avatar Dec 06 '23 05:12 uloveqian2021

@uloveqian2021 您好,72B lora + ds zero3微调的显存用量可以参考这里,8卡A800服务器应当是可以跑起来的。

fyabc avatar Dec 08 '23 02:12 fyabc

各位大神,我没有做过千问的微调,想咨询一下72b int4如何做lora微调,使用哪个脚本

wengyuan722 avatar Dec 09 '23 03:12 wengyuan722

各位大神,我没有做过千问的微调,想咨询一下72b int4如何做lora微调,使用哪个脚本

我也想知道你有进展吗?

JavinYang avatar Dec 17 '23 14:12 JavinYang