Attention-ocr-Chinese-Version icon indicating copy to clipboard operation
Attention-ocr-Chinese-Version copied to clipboard

预测结果

Open ElagJun opened this issue 6 years ago • 3 comments

再次请教 ,训练数据30多万,loss 降到60左右就不往下降了,预测生成的图像有的还可以,但预测切出来的图像,比如 1525072054 0822partimg 就不好,结果是:7u1Ii░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░ 是训练还不够吗

ElagJun avatar Apr 30 '18 09:04 ElagJun

@ElagJun 我觉得可能有两种原因,其中一个原因可能是训练样本数量不够或者是样本中文本的分布与真实场景不符(比如英文字母太多,生僻字太多等等);另一个原因可能是切出来的图像经过reshape后,比例失真了。建议可以针对特定的应用场景,用特定分布的数据进行训练,并保证reshape后的图片不失真。

A-bone1 avatar Apr 30 '18 11:04 A-bone1

@A-bone1 谢谢 我再生成写图片

ElagJun avatar May 03 '18 05:05 ElagJun

请问作者,我训练的字库,如果是几百个汉字,效果是比较好的,当字库内的汉字总数达到1000以上,训练600k次后,发觉程序无法识别这些汉字。。是不是模型的瓶颈到了。

wkhunter avatar May 30 '18 01:05 wkhunter