pekinghk

Results 8 comments of pekinghk

我也遇到了acc=0的问题,原因应该是作者在训练加载模型的时候没有加载最后一层RNN层的权重,这当然有利有弊,如果你想要充分利用作者预训练模型的训练结果,可以把模型的所有权重都加上,这样在finetune模型的时候会有比较好的初始效果。 我改动了5个地方之后可以正常训练了,可以正常训练。 1.if 'rnn.1.embedding' not in name:##不加载最后一层权重 注释掉这一行 2.将这一行:from crnn.models.crnn import CRNN 改成: from crnn.crnn_torch import CRNN 3.如果pytorch版本比较高,将crnn/util.py中loadData函数中的v.data.resize_(data.size()).copy_(data)换成v.resize_(data.size()).copy_(data) 4.如果wrap_ctc编译不通过,可以采用高版本pytorch原生的ctc,直接将ctc的引用替换成这一句就行from torch.nn import CTCLoss,或者也可以用百度的扩展ctc。 5.把训练代码中的val函数里的pred = predict(im)这一行改成pred = predict(net, im),同样的把这个函数def predict(im):的输入形式改成def predict(net,...

我也遇到了这个问题,请问后来解决了么

Hope this function could be used quickly

而且我发现一个问题,对于比较长的图,越靠近图像下部,拟合边界会有整体上移的趋势,大家有遇到么

> > 而且我发现一个问题,对于比较长的图,越靠近图像下部,拟合边界会有整体上移的趋势,大家有遇到么 > > pse也是这个问题,[whai362/PSENet#121](https://github.com/whai362/PSENet/issues/121) 好的,十分感谢

> 把长和宽都resize到32的倍数就没问题了,因为icdar图片大小都是一样的而且是32的倍数,所以这个项目里没出问题 @pekinghk 好的,我试试

我也遇到了这个问题,请问后来解决了么

I've noticed the same issue. It appears that the author has just utilized the encoder and decoder network architecture from movqgan and has retrained a VAE model. I'm not sure...