Firefly
Firefly copied to clipboard
qwen2 pretrain loss非常大
qwen2 pretrain loss非常大,不知道什么问题,10点多,用llama-factory就没有这个问题,float32和bf16都试了,还是无法解决