lzl

Results 1 issues of lzl

请问Warm-up训练也是使用SFT做的全参微调吗?如果是的话,使用的训练超参数是否也与后续训练一致呢?