DAN 关于训练出现loss变为NAN的问题

关于训练出现loss变为NAN的问题

Open lyongo opened this issue 3 years ago • 2 comments

作者你好，谢谢你非常不错的工作，在我训练时大约在60k个iter会出现loss都变成NAN的情况并且按照 issue#8 的解决办法选取checkpoint继续train 但是一段时间后还是会出现loss变为NAN的情况（如下图），似乎无法解决，想请教一下您怎么train让模型收敛到最终的结果的？

Dec 15 '21 11:12 lyongo

我也遇到这个问题，请问您解决了吗，就突然可能会nan

May 24 '23 03:05 Synapsess

我也遇到了这个问题，请问您解决了吗

Jun 16 '23 01:06 chunzhang07