Attention-ocr-Chinese-Version
Attention-ocr-Chinese-Version copied to clipboard
预测结果
再次请教 ,训练数据30多万,loss 降到60左右就不往下降了,预测生成的图像有的还可以,但预测切出来的图像,比如
就不好,结果是:7u1Ii░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░
是训练还不够吗
@ElagJun 我觉得可能有两种原因,其中一个原因可能是训练样本数量不够或者是样本中文本的分布与真实场景不符(比如英文字母太多,生僻字太多等等);另一个原因可能是切出来的图像经过reshape后,比例失真了。建议可以针对特定的应用场景,用特定分布的数据进行训练,并保证reshape后的图片不失真。
@A-bone1 谢谢 我再生成写图片
请问作者,我训练的字库,如果是几百个汉字,效果是比较好的,当字库内的汉字总数达到1000以上,训练600k次后,发觉程序无法识别这些汉字。。是不是模型的瓶颈到了。