GmailF

Results 1 comments of GmailF

> ### System Info > 同样的训练配置,但是两个模型的表现效果差异很大,qwen3-vl-8b会经常波动,用的verl仓库代码是10月初的,不知道是不是框架的原因 > > ### Information > * [ ] The official example scripts[x] My own modified scripts > > ### Tasks > * [x] An...