ZJ
ZJ
请问在python3下面你们可以运行么?怎么将这个嵌入crnn训练做数据增强,有人试验过么?我在crnn训练的时候随机对原图进行三种变化之一,可是程序在docker里面都会报错Connection reset by peer,然后产生core.***的文件。这个项目下的demo.py我是可运行的。就是训练时候出错
`im_Distort = Augment.GenerateDistort(im, 4)` 我把上面的4变小一点,出现错误跟[https://github.com/Canjie-Luo/Scene-Text-Image-Transformer/issues/3](https://github.com/Canjie-Luo/Scene-Text-Image-Transformer/issues/3)一样,Floating point exception. 错误是在训练了一些迭代之后出现的
请问这个原图太小指的图片高度大概多少啊,我用的就是crnn的synth90k那个数据集,图片高度基本都是30多像素。请问形变之前都得resize到相同的形状么
@zcswdt 你说的是应该是每个batch的数据之间的宽度可以不一样,支持不定长吧。但是每个batch之内的图片还是会缩放到同一尺寸的,可以通过对batch的数据进行填充或者resize
@zcswdt 有啊,就是通过对每个batch图片resize或者填充到指定大小即可,不同batch之间可以不一样,你可以参考这个[https://github.com/Holmeyoung/crnn-pytorch/blob/master/dataset.py#L117](https://github.com/Holmeyoung/crnn-pytorch/blob/master/dataset.py#L117)
@abcxs 他这个是resize 破坏了ratio,但是你可以改代码进行填充而不是resize的啊
@chen1234520 测试时候一般都是任意宽度的,保证cnn出来的特征高是1就行,由于后面是lstm这种rnn结构,宽度的不同其实只是送到lstm的序列时间步不同
@yang0817manman Hi, can you share the fine-tuned model to me? I set an email to @seasonSH ,but have not received reply.
@0aqz0 请问按照fps 30 解码的吗
给的是视频,视频解码帧不是可以设置fps的吗。每一帧是不是就是30fps啊,我看科大的数据用kinect采集就是30fps采集的