BELLE
BELLE copied to clipboard
To fine-tune how much gpu is required for the BELLE-7B-2M model, I am now fine-tuning the error memory overflow reported on the a100
To fine-tune how much gpu is required for the BELLE-7B-2M model, I am now fine-tuning the error memory overflow reported on the a100
share your code
@weberrr
A100 80G显存够微调 BELLE-7B-2M非量化的模型吗?量化版的模型微调后不能正确回答@weberrr
8卡16g能否train动BELLE-7B-2M模型?
8卡16g能否train动BELLE-7B-2M模型?
可以尝试deepspeed采用offload cpu的配置,不然16g的显存是不够的
8卡16g能否train动BELLE-7B-2M模型?
可以尝试deepspeed采用offload cpu的配置,不然16g的显存是不够的
你好,请问我用lora的方式train起来了 但是loss到第二步就是0了,这是为啥呢
8卡16g能否train动BELLE-7B-2M模型?
可以尝试deepspeed采用offload cpu的配置,不然16g的显存是不够的
你好,请问我用lora的方式train起来了 但是loss到第二步就是0了,这是为啥呢
我们已经更新了代码,基于deepspeed-chat完善。您可基于最新的代码进行实验。