LongAlign icon indicating copy to clipboard operation
LongAlign copied to clipboard

微调训练问题

Open mhzn-yn opened this issue 1 year ago • 1 comments

1、作为微调来说,是用基础模型重新训练,还是使用微调的方式。 2、如果需要重新训练一个7b模型需要多少显存,说明中没有找到相关硬件需求表格。 3、对于长文本输入的情况下,更加适用于那种方式。

mhzn-yn avatar Sep 30 '24 18:09 mhzn-yn

  1. 建议在已经经过长度扩展的base模型上做Long Context Alignment微调(SFT, DPO)
  2. 显存占用取决于序列长度,比如我们论文中64k长度开zero3训练需要80G显存
  3. 如果你的base模型已经在更长的序列上加训过(长度扩展)则只微调即可,否则需要先做加训

bys0318 avatar Oct 27 '24 09:10 bys0318