chinese_ocr icon indicating copy to clipboard operation
chinese_ocr copied to clipboard

急!densenet训练自己的数据(全英文字母和数字)为何loss和val_loss总是那么高呢,acc和val_acc保持相当,最高只能达到0.94,最低的时候也是1.2了,我逐个查看了数据,数据没什么问题,数据量为200w

Open zhangsn828 opened this issue 5 years ago • 6 comments

如题,请各位高手赐教,谢谢!

zhangsn828 avatar May 16 '19 01:05 zhangsn828

如题,请各位高手赐教,谢谢!

哥们你也是英文字母和数字混合吗?训练了多少代达到这个结果。我400万的数据,训练了两代,acc是0.82, loss是1.52。方便的话线下交流下,wechat: 15651859966

jake221 avatar May 27 '19 12:05 jake221

请问下大佬是咋弄标签的,我现在有自己的图片

foundersix avatar May 31 '19 03:05 foundersix

请问下大佬是咋弄标签的,我现在有自己的图片

text_renderer:https://github.com/Sanster/text_renderer 或者https://github.com/Belval/TextRecognitionDataGenerator

jake221 avatar Jun 04 '19 06:06 jake221

您好,我使用作者提供的原数据进行训练,为什么loss居然是负数,请问有遇到这样的情况吗? image

pingzi5233 avatar Jun 11 '19 06:06 pingzi5233

已经解决loss为负数的问题,是在读取char_std_5990.txt时格式有点不对,导致没读取到,densenet网络的out层输出个数为1,而不是5990,供后期遇到同样问题的人参考 之前loss出现异常,为负数的情况: ab95923eeacf0d038874a4a81dd464f 修改之后loss正常: 6ab0c905978c6bc54ccf77f7174b5d6

pingzi5233 avatar Jun 11 '19 07:06 pingzi5233

@zyjcs ,@pingzi5233,@jake221有没有评估准确率、召回率、识别率的代码?

666888985 avatar Aug 11 '20 08:08 666888985