Attention-ocr-Chinese-Version
Attention-ocr-Chinese-Version copied to clipboard
模型收敛问题
你好,想问一下,我在中文数据集上训练后,loss从150左右降到35, 但模型对于不同图片的预测结果始终是相同的37个汉字,比如“并并并.......”,能请教一下可能是什么问题吗?或者是什么问题导致模型不收敛呢?
你好,我当时在训练模型时,前阶段的预测结果也只有相同的汉字。但随着训练的进行,模型就可以预测出正确的汉字了。所以,其中一个原因可能是训练次数不够,另一个原因可能是生成tfrecord时文本标签没有正确生成。建议可以打开tensorboard,看看image与text是否能够一一对应
你好,模型里面用到tfrecord文件中的image/encoded和image/class这两个属性,image/text这个属性在模型构建中没有用到吧?
训练中应该没用到,但是在tensorboard中会根据image/text呈现样本真实标签,建议可以用tensorboard打开logs中的文件进行详细内容的查看。其中,也能直接看到随机采样一些预测文本。
我tensorboard已确认image和text,tfrecord已经正确生成,但是训练了几天,loss一直稳定在30左右,想请教作者,你训练5000个汉字,最终训练了多久时间,才能有效果?
@wkhunter 你好,我当时180万的合成图片大概1个epoch就有初步效果了,后面loss也稳定在了40左右,但是,随着迭代次数的增多,验证集上的准确度是有在一直提升的,你可以在训练的同时运行在验证集上运行python eval.py,然后调节里面每次测试准确率的间隔时间,看准确率是否一直在持续增加