LongAlign
LongAlign copied to clipboard
微调训练问题
1、作为微调来说,是用基础模型重新训练,还是使用微调的方式。 2、如果需要重新训练一个7b模型需要多少显存,说明中没有找到相关硬件需求表格。 3、对于长文本输入的情况下,更加适用于那种方式。
- 建议在已经经过长度扩展的base模型上做Long Context Alignment微调(SFT, DPO)
- 显存占用取决于序列长度,比如我们论文中64k长度开zero3训练需要80G显存
- 如果你的base模型已经在更长的序列上加训过(长度扩展)则只微调即可,否则需要先做加训