SRN.pytorch
SRN.pytorch copied to clipboard
Unofficial PyTorch implementation of Towards Accurate Scene Text Recognition with Semantic Reasoning Networks
我注意到这个训练集中Synthtext数据集并不是完整的数据集,只有200多万张图片
你好博主,我在跑demo程序的时候,使用的iter_65000.pth模型,结果出来copying a param with shape torch.Size([38, 512]) from checkpoint, the shape in current model is torch.Size([39, 512]).这个报错,demo默认的模型因该是iter_30000这个,是我导入模型的问题,还是需要调节哪边参数,谢谢博主
Can you please share the model such that people with no Baidu account can download the model
acc 0?
我用MJ数据集也没有训起来,报错:`assert len(datasets) > 0, 'datasets should not be an empty iterable' `,这是因为什么呢
感谢您的工作与分享,有一个问题困扰我很久,就是如何绘制论文中的attention map ,如何将这一过程可视化。你能方便告诉我方法吗?或者您能开源绘图的code我将不胜感激,谢谢您
作者你好,我在看论文的时候有些问题想请教下,比如PVAM 中的reading order加入有什么必要原因吗,另外总觉得这篇和2DAttentionalIrregularSceneTextRecognizer这一篇的思路很相近,看起来堆叠了更多的attention......
小菜一枚,首先非常感谢作者的开源,我跑了个模型,想转为C++能调用的pt模型,但是,torch.jit.trace()好像无法trace numpy操作以及for操作,具体原因是否如此,pytorch git上好像也没有找到合理的解释,有些numpy转为torch是可以的,但是还是无法全部转换,请问是否有完全利用torch替换numpy的方案呢,比如for循环的计算
您好,大神,很感谢您的开源代码,非常棒,我有一个问题想问一下,n_position对应的维度是视觉特征提取后的w(宽度)吗?但是宽度是变化的,这样很容易报错了?大神我的理解对吗? File "SRN_modules.py", line 65, in forward return x + self.pos_table[:, :x.size(1)].clone().detach() RuntimeError: The size of tensor a (320) must match the size of tensor b (256) at non-singleton dimension...