Qwen2.5
Qwen2.5 copied to clipboard
sft 7B model_max_length=90000 24 A00 OOM
参考这里https://qwen.readthedocs.io/zh-cn/latest/training/SFT/example.html脚本
使用 24张A100,对7B sft,model_max_length超过2w时,OOM