Chao Cheng

Results 4 comments of Chao Cheng

1. 将自己的数据准备好标签文件,文件内容格式参考项目中的train.txt即可。 2. 参考crnn_main_v2.py里面的内容,修改对应的dataloader中的图片位置、标签文件路径参数即可进行自己数据集的训练。 3. 如果想用他的模型作为你的初始化参数,可以在params.py中的expr参数进行指定。 ps. 可以计算出自己的图片的均值、标准差的信息,替换掉params.py中的均值标准差参数。也可以根据自己的图片实际情况修改网络结构、进入网络放缩的图片的宽高情况。不过这样的话就不能用项目中已有模型参数进行初始化,自己重新训练即可。

alphabet.py内是模型的字典,根据你自己需要识别的情况修改。loss到325……这个训练下去loss会有下降么?

@ShangLe0607 对,就改成你要识别的。有下降说明训练中是在提升的,看看val上的准确率有进步么?不过我训练过程中倒是没碰到过多少报错,仅有的几次后来发现是我的标签文件没做好导致读取不到图片。

没什么特别的要求。repo中默认的训练参数是图片长度280,对应一个长度为10的字符串;检测的时候则是进行不定长识别。这个图片像素长度可以根据你自己的数据情况修改。内部网络结构的话,ctc编码长度大约是图片像素长度/4,在考虑到ctc编码最好能做到长度是识别内容的两倍左右,那么对应的文本长度大概是图片像素长度/8.