wuxiaolianggit

Results 55 comments of wuxiaolianggit

首先很感谢大佬的开源工作和回复,我还有一个问题想问您,您的loss计算不用ctc,在计算loss的时候使用交叉熵计算loss,那ground truth和pred的维度是怎么做到对齐的呢 @opconty

真的很感谢大佬的回复,我仔细看看大佬的文章啊

您好,大神,仔细读了您的代码,发现特征提取之后维度顺序是x = self.adaptive_avg_pool(x.permute(0,3,1,2)) # [b, c, h, w] -> [b, w, c, h],然后经过bilstm,在利用tarnsformer对其进行pred,但是对其进行PositionalEncoding编码时,感觉没有利用到位置信息,如果把[b,w,c]变成[w,b,c]会不会就利用了位置信息,会不好一点?

您好,大神,仔细读了您的代码,发现特征提取之后维度顺序是x = self.adaptive_avg_pool(x.permute(0,3,1,2)) # [b, c, h, w] -> [b, w, c, h],然后经过bilstm,在利用tarnsformer对其进行pred,但是对其进行PositionalEncoding编码时,感觉没有利用到位置信息,如果把[b,w,c]变成[w,b,c]会不会就利用了位置信息,会不好一点? @opconty

大神您好,我调整了训练参数,从新训练了模型,效果和之前的crnn效果差不多,没有下降也没有提高,看了您的代码,是只支持定长训练,是这样吗 @opconty

您好,大佬,我用的是中文数据集训练的,如果我增加transformer中nhead的数量,变成8,效果会不会好一点呢 @opconty

不哈意思啊,大佬,我用的中文数据集是公司内部数据集,我尝试用合成数据的代码生成一批,到时候上传到百度云上给您啊。

请问大神,训练集的mask图如何制作呢,训练集样例及训练代码作者能否提供一下,我的邮箱是[email protected],非常感谢您啊。 @wenlihaoyu