Whitefish
Results
2
issues of
Whitefish
When I ran the ner task in multiple GPUs, the program crashed and logging the error messages as the title like. I try to fix the bug and I just...
我刚开始使用co-deformable-swin-large-1x训练了12个epoch,得到epoch12.pth(结束时候loss为41左右),之后我将前面得到的模型作为预训练模型,继续使用相同的数据集训练12epoch,这时候开始训练的loss竟然达到了148,也就是完全从0开始训练时候的Loss,最终结果观察到也是仍然和第一次的epoch12.pth一模一样。 请问这个什么原因导致的? 与此同时,训练开始的时候的第一个epoch不论什么模型都是mAP全部是0.0000,我怀疑模型并没有加载预训练权重或者checkpoint。 请您帮我看看这是什么问题导致的。万分感谢您!