CRNN_Chinese_Characters_Rec icon indicating copy to clipboard operation
CRNN_Chinese_Characters_Rec copied to clipboard

训练图片大小

Open yunjuanya opened this issue 4 years ago • 4 comments

对图片的长度要求吗?

yunjuanya avatar Oct 02 '19 06:10 yunjuanya

没什么特别的要求。repo中默认的训练参数是图片长度280,对应一个长度为10的字符串;检测的时候则是进行不定长识别。这个图片像素长度可以根据你自己的数据情况修改。内部网络结构的话,ctc编码长度大约是图片像素长度/4,在考虑到ctc编码最好能做到长度是识别内容的两倍左右,那么对应的文本长度大概是图片像素长度/8.

dc-chengchao avatar Oct 14 '19 02:10 dc-chengchao

我的label如果过长的话,loss会变成nan或者inf

mangoHoli avatar Oct 14 '19 12:10 mangoHoli

@dc-chengchao 您好,您说的280指的是生成的图像的宽度吧?但是训练的时候又resize成宽度为160了,为什么要这样做呢,这样不是把原先比较正常的形状的文字压瘦了?我看到github上好几个作者都是这样做的,不明白出于什么原因。

CabbageWust avatar Apr 17 '20 10:04 CabbageWust

@dc-chengchao 您好,您说的280指的是生成的图像的宽度吧?但是训练的时候又resize成宽度为160了,为什么要这样做呢,这样不是把原先比较正常的形状的文字压瘦了?我看到github上好几个作者都是这样做的,不明白出于什么原因。

我直接改代码了,图片原比例280进入模型训练,正常训练

ingale726 avatar Jan 10 '21 05:01 ingale726