SRN.pytorch icon indicating copy to clipboard operation
SRN.pytorch copied to clipboard

Unofficial PyTorch implementation of Towards Accurate Scene Text Recognition with Semantic Reasoning Networks

Results 18 SRN.pytorch issues
Sort by recently updated
recently updated
newest added

我注意到这个训练集中Synthtext数据集并不是完整的数据集,只有200多万张图片

你好博主,我在跑demo程序的时候,使用的iter_65000.pth模型,结果出来copying a param with shape torch.Size([38, 512]) from checkpoint, the shape in current model is torch.Size([39, 512]).这个报错,demo默认的模型因该是iter_30000这个,是我导入模型的问题,还是需要调节哪边参数,谢谢博主

Can you please share the model such that people with no Baidu account can download the model

我用MJ数据集也没有训起来,报错:`assert len(datasets) > 0, 'datasets should not be an empty iterable' `,这是因为什么呢

感谢您的工作与分享,有一个问题困扰我很久,就是如何绘制论文中的attention map ,如何将这一过程可视化。你能方便告诉我方法吗?或者您能开源绘图的code我将不胜感激,谢谢您

作者你好,我在看论文的时候有些问题想请教下,比如PVAM 中的reading order加入有什么必要原因吗,另外总觉得这篇和2DAttentionalIrregularSceneTextRecognizer这一篇的思路很相近,看起来堆叠了更多的attention......

小菜一枚,首先非常感谢作者的开源,我跑了个模型,想转为C++能调用的pt模型,但是,torch.jit.trace()好像无法trace numpy操作以及for操作,具体原因是否如此,pytorch git上好像也没有找到合理的解释,有些numpy转为torch是可以的,但是还是无法全部转换,请问是否有完全利用torch替换numpy的方案呢,比如for循环的计算

您好,大神,很感谢您的开源代码,非常棒,我有一个问题想问一下,n_position对应的维度是视觉特征提取后的w(宽度)吗?但是宽度是变化的,这样很容易报错了?大神我的理解对吗? File "SRN_modules.py", line 65, in forward return x + self.pos_table[:, :x.size(1)].clone().detach() RuntimeError: The size of tensor a (320) must match the size of tensor b (256) at non-singleton dimension...