OCR训练如何添加图片扩增（data augmentation)功能?

Open wenston2006 opened this issue 6 years ago • 3 comments

OCR训练中发现attention model很容易过拟合，　因此想在训练时候进行图片扩增（实时的进行旋转，裁剪，加噪声，扭曲），请问有没有这方面的功能？

Dec 30 '19 08:12 wenston2006

@wanghaoshuang ，麻烦解决一下这个问题

Dec 31 '19 10:12 XingWu01

请通过修改data_reader.py来添加需要的数据增广操作，在这个脚本中可以调用各种Python库对读入的图片进行操作。

Jan 02 '20 07:01 wanghaoshuang

@wanghaoshuang 请问，OCR用95个NUM_CLASSES的dict_map的对应关系是什么？做inference时输出的是标签序号，不知道输出的标签对应什么字符，从而不方便判断inference的效果，麻烦分享一下，谢谢！

May 08 '20 13:05 lishiyu93