InternLM-XComposer icon indicating copy to clipboard operation
InternLM-XComposer copied to clipboard

全参数微调需要显存?以及多卡模型分布的问题。

Open hekaijie123 opened this issue 9 months ago • 1 comments

你好。我有两张A100 (40G)显存。

  1. 但是我运行全参数微调时batchsize=1也会超显存,全参数微调需要单张卡的显存多少?有没有办法将模型分不到两张卡上做训练?
  2. 我想做某个领域知识的预训练,全参数微调是否可行,需要多少量级的数据。如果全参数微调不可行,那么是否可以多阶段lora微调?

hekaijie123 avatar May 15 '24 08:05 hekaijie123

@myownskyW7 @LightDXY @lvhan028

hekaijie123 avatar May 15 '24 08:05 hekaijie123