CRNN_Chinese_Characters_Rec icon indicating copy to clipboard operation
CRNN_Chinese_Characters_Rec copied to clipboard

关于训练LOSS出现NAN的情况

Open ingale726 opened this issue 3 years ago • 4 comments

使用pytorch自带的CTCLOSS,pytorh版本1.7.1,训练自己的数据集,出现了NAN,将训练集中标签长度大于40的剔除,并删除对应的图片后,训练正常,没有出现NAN 使用第三方CTCLOSS也可以解决NAN的情况 https://github.com/SeanNaren/warp-ctc 我用的这个,没有出现NAN,但是GIT主的预处理模型似乎没用了,LOSS很大,不如用自带的LOSS配合GIT主的预处理模型,LOSS下降的快

ingale726 avatar Jan 11 '21 02:01 ingale726

至于GIT主说的用pytorch1.2版本训练没有出现NAN,我猜应该是GIT主的训练集里没有字数特别多的图片和标签,比如说字数大于40个,应该pytorch各个版本都有这样的问题

ingale726 avatar Jan 11 '21 06:01 ingale726

你是pytorh版本1.7.1下安装了第三方CTCLOSS的吗? 我在1.6版面下安装不成功第三方CTCLOSS, 提示ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead. 运行python setup install, 报的错误

arnozeng avatar Jan 15 '21 08:01 arnozeng

你是pytorh版本1.7.1下安装了第三方CTCLOSS的吗? 我在1.6版面下安装不成功第三方CTCLOSS, 提示ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead. 运行python setup install, 报的错误

百度一下就找到答案了 https://blog.csdn.net/ShuqiaoS/article/details/88420326 网上有安装第三方CTCLOSS的博客,就是安装过程是坑较多,多看看issues

ingale726 avatar Jan 15 '21 08:01 ingale726

你是pytorh版本1.7.1下安装了第三方CTCLOSS的吗? 我在1.6版面下安装不成功第三方CTCLOSS, 提示ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead. 运行python setup install, 报的错误

https://blog.csdn.net/xiao13mm/article/details/112426460

ingale726 avatar Jan 15 '21 08:01 ingale726