models
models copied to clipboard
OCR训练如何添加图片扩增(data augmentation)功能?
OCR训练中发现attention model很容易过拟合, 因此想在训练时候进行图片扩增(实时的进行旋转,裁剪,加噪声,扭曲),请问有没有这方面的功能?
@wanghaoshuang ,麻烦解决一下这个问题
请通过修改data_reader.py来添加需要的数据增广操作,在这个脚本中可以调用各种Python库对读入的图片进行操作。
@wanghaoshuang 请问,OCR用95个NUM_CLASSES的dict_map的对应关系是什么?做inference时输出的是标签序号,不知道输出的标签对应什么字符,从而不方便判断inference的效果,麻烦分享一下,谢谢!