PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

ppocrv3开源的预训练识别模型不对

Open shuizhonghaitong opened this issue 2 years ago • 3 comments

你好,我使用相同的数据集,分别用ppocrv2和ppocrv3来finetune,都加载了各自的预训练模型,可以看到在最开始的step里,ppocrv2 acc 是0.29,而ppocrv3 acc是0。下面的两张图分别是v2和v3的。 image image 但是讲道理v3加载预训练模型之后,在最初的step里acc应该超过v2的才对。所以怀疑是不是v3开源的预训练模型有问题,麻烦check一下,谢谢!

shuizhonghaitong avatar Oct 13 '22 03:10 shuizhonghaitong

可以多训一段时间看看,v3的模型包含gtc模块,某些场景里是会出现初始acc为0的情况

littletomatodonkey avatar Oct 14 '22 13:10 littletomatodonkey

我尝试训练到100个epoch,确实acc会逐渐上升。但我还有两个问题希望请教一下。1、在训练的过程中,我发现在相同的epoch下,v3的效果没有v2好,无论是train acc还是dev acc,这是正常的嘛?v3的效果要超过v2的话是不是v3需要用的epoch要比v2多?2、如果几十万的训练数据,对于v2和v3,各自大约需要跑多少个epoch呢?

shuizhonghaitong avatar Oct 16 '22 14:10 shuizhonghaitong

ppocrv3开源的预训练识别模型,我试着效果也不好

llwowowowoll avatar Nov 11 '22 08:11 llwowowowoll