Qwen2.5
Qwen2.5 copied to clipboard
请问作者有尝试过neftune实验吗?
作者你好,目前我在qwen1.5上实验时,发现泛化性能不是特别好; 看这个研究说是有帮助,请问下你们之前有没有试过neftune_noise_alpha,如果有的话alpha设置多少会比较好呢? https://github.com/neelsjain/NEFTune