crnn.pytorch how about 5000 alphabet?

how about 5000 alphabet?

Open Aurora11111 opened this issue 5 years ago • 35 comments

hello,have you tried use more alphabet? I have followed your ways to trianed rcnn model with just 10 numbers,10 chinese chars,10 mixed chinese chars and numbers and lower alpha,these model all perform well.but,when I try to trained a 5000 alphabet model ,the loss can't converge,it's about 75,do you know how to solve it?

Sep 13 '18 04:09 Aurora11111

@Aurora11111 您好,请问一下你的10 numbers,10 chinese chars,10 mixed chinese chars and numbers and lower alpha是怎样训练的啊?制作数据集是用的哪个文件,我数据集做好了,但是感觉有问题,你能不能帮我看一下啊,谢谢啦?另外方便留一下您的邮箱或者其他联系方式吗,感激不尽!

Sep 16 '18 11:09 ZJU-PLP

@ZJU-PLP refference: https://github.com/Aurora11111/TextRecognitionDataGenerator

Sep 17 '18 02:09 Aurora11111

@Aurora11111 感谢回复,请问您最后数据集是做成ldmb格式吗?具体是路径--图片名--lable的格式吗?

Sep 17 '18 04:09 ZJU-PLP

@ZJU-PLP yes. 生成lmdb的参数需是:图片路径list,标签list 且一一对应

Sep 17 '18 06:09 Aurora11111

@Aurora11111 我做好数据集后训练时出现了这个问题,请问你有遇到过嘛,在网上查不到这个问题 selection_029

Sep 17 '18 08:09 ZJU-PLP

@Aurora11111 这上面写着是python3.x啊 selection_030

Sep 17 '18 09:09 ZJU-PLP

@Aurora11111 谢谢提醒,按照你建议的方法,用Python2.x生成的数据集,但是训练的时候出现了这个问题,请问你训练的时候也是配置的python2.x的环境吗?

Sep 18 '18 01:09 ZJU-PLP

只有生成lmdb用的python2.x 你的datasets.py和utils.py也需要参照https://github.com/Aurora11111/crnn-train-pytorch 链接里的改一下

Sep 18 '18 01:09 Aurora11111

@Aurora11111 好的,非常感谢,目前已经跑通了,开始正常训练了,请问你0~9数字最后的准确率达到了多少呢?迭代了多少个epoch啊?

Sep 18 '18 03:09 ZJU-PLP

我的也就一个迭代不到就到1了

Sep 18 '18 03:09 Aurora11111

@Aurora11111 这么快嘛,我目前跑了14个epoch,arc为0.53,不过数据集做的2W,估计没有你的多

Sep 18 '18 03:09 ZJU-PLP

@ZJU-PLP 恩,你的数据集应该弄多一些

Sep 18 '18 03:09 Aurora11111

@Aurora11111 run demo.py出现这个问题.但是用之前下载的模型跑没问题,你跑的时候有遇到过吗?

Sep 18 '18 05:09 ZJU-PLP

@ZJU-PLP 需要修改demo.py中的参数与训练中的参数一致!

Sep 18 '18 06:09 Aurora11111

@Aurora11111 训练时隐藏层数为128,demo.py中的参数也为128,其他参数都一样啊

Sep 18 '18 06:09 ZJU-PLP

@ZJU-PLP 这个问题issue里有:

reference:https://github.com/Aurora11111/crnn-train-pytorch/blob/master/demo.py

Sep 18 '18 06:09 Aurora11111

@Aurora11111 你说的是这个吧,按这个方法来试过,并没有解决

Sep 18 '18 06:09 ZJU-PLP

@Aurora11111 ok,按你最新的代码可以跑通,谢谢!

Sep 18 '18 06:09 ZJU-PLP

@Aurora11111 您好,请教您最后有测过其他图片吗?我训练的时候模型显示准确率到了90%多,用测试集的图片去做测试,发现准确率也还OK,我数据集是train(20万)和val(5wan).但是用现实场景中的图片做测试,测试了好几张,完全是错的,请问你有遇到过这个问题嘛?感觉这两张图片也很相似啊,左边是数据集(都是电子字体)中的图片,右边是真实图片截取的一部分,完全检测不出来,放一大张图片就更检测不出来了检测结果:

Sep 19 '18 11:09 ZJU-PLP

请问所有的类别都要用alphabet列出来吗，比如说中文常见字有上千个，那是不是得在设置alphabet参数时将这些都列出来？数目这么多如果都要列出来的话需要用什么方法呢？

Sep 21 '18 08:09 liuyiyiyiyi

@liuyiyiyiyi 是的，https://github.com/Aurora11111/TextRecognitionDataGenerator/blob/master/TextRecognitionDataGenerator/dicts/cn.txt 这里面修改

Sep 21 '18 08:09 Aurora11111

使用你提供的样本自动生成代码，https://github.com/Aurora11111/TextRecognitionDataGenerator，是否可以将字体改成想要的形式，比如说：白色正楷粗体

Sep 29 '18 02:09 liuyiyiyiyi

你要改里面的font吧

Sep 29 '18 02:09 Aurora11111

@Aurora11111 Thank you for DataGenerator. Is it possible to change color of fonts?

Oct 02 '18 07:10 helium390

如果我是要对自然场景下的中文字进行识别，那我生成的数据是不是要尽量与该自然场景下的中文字相似，比如说：背景和字体，if I want to recognize Chineses character in natural scene,should I keep the generated data,like background and fonts,more similar to the data in natural scene?

Oct 09 '18 01:10 liuyiyiyiyi

是的

Oct 09 '18 03:10 Aurora11111

你好，我用从自然场景下抠下来的文本进行预测，预测出来的标签序列有我的alphabet中不包含的字符，我感觉这个很奇怪，请问你有碰到过这个问题吗

Oct 11 '18 06:10 liuyiyiyiyi

@liuyiyiyiyi 那你要自己做一个dictionary了

Oct 11 '18 06:10 Aurora11111

请问这个跟dictionary有什么关系

Oct 11 '18 07:10 liuyiyiyiyi

@Aurora11111 请教一下如果我想c++借口调用这个模型应该怎么做

Nov 19 '18 08:11 HouBiaoLiu

@HouBiaoLiu 没试过,但是我觉得可以写个C++调用python的接口

Nov 19 '18 10:11 Aurora11111

@Aurora11111 我遇到了之前 @ZJU-PLP 遇到的那几个问题，我直接用了你的crnn-train-pytorch,但是我对数据集的数据结构表示迷惑。我通过你的getLmdb.py写出的数据list是类似于： /home/users/Desktop/data/img/IMG_3222.JPG 图片3222文本内容 是这样么？可以给我一个样例么？

Mar 26 '19 09:03 Giggledefy

@Giggledefy 是的这是python3与python2的unicode编码问题,你用python2.x调用getlmdb就可以了.其他还是用你python3

Mar 28 '19 02:03 Aurora11111

@Aurora11111 您好,请教您最后有测过其他图片吗?我训练的时候模型显示准确率到了90%多,用测试集的图片去做测试,发现准确率也还OK,我数据集是train(20万)和val(5wan).但是用现实场景中的图片做测试,测试了好几张,完全是错的,请问你有遇到过这个问题嘛?感觉这两张图片也很相似啊,左边是数据集(都是电子字体)中的图片,右边是真实图片截取的一部分,完全检测不出来,放一大张图片就更检测不出来了检测结果:

您好，我也碰到了这样的问题，请指点对应的解决办法

Apr 24 '19 07:04 Pratyeka

@Pratyeka reference :https://github.com/Aurora11111/TextRecognitionDataGenerator

Apr 26 '19 08:04 Aurora11111

crnn.pytorch crnn.pytorch copied to clipboard

how about 5000 alphabet?

crnn.pytorch
crnn.pytorch copied to clipboard