models icon indicating copy to clipboard operation
models copied to clipboard

OCR训练如何添加图片扩增(data augmentation)功能?

Open wenston2006 opened this issue 5 years ago • 3 comments

OCR训练中发现attention model很容易过拟合, 因此想在训练时候进行图片扩增(实时的进行旋转,裁剪,加噪声,扭曲),请问有没有这方面的功能?

wenston2006 avatar Dec 30 '19 08:12 wenston2006

@wanghaoshuang ,麻烦解决一下这个问题

XingWu01 avatar Dec 31 '19 10:12 XingWu01

请通过修改data_reader.py来添加需要的数据增广操作,在这个脚本中可以调用各种Python库对读入的图片进行操作。

wanghaoshuang avatar Jan 02 '20 07:01 wanghaoshuang

@wanghaoshuang 请问,OCR用95个NUM_CLASSES的dict_map的对应关系是什么?做inference时输出的是标签序号,不知道输出的标签对应什么字符,从而不方便判断inference的效果,麻烦分享一下,谢谢!

lishiyu93 avatar May 08 '20 13:05 lishiyu93