PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

训练检测模型,图片上有中文有英文,只想要中文部分,英文字母的可以不标注么?

Open ainndejj11 opened this issue 3 years ago • 1 comments

例如,身份证和表格(有些身份证中文上面是有相应的英文字母的) 只想要中文的部分,那么英文字母,在训练检测模型时,可以不标注图片中英文的部分,只标注图片中文的部分么,对检测模型效果会有影响吗??

还是都需要标,在后处理时候,在判断英文的部分,给它筛除掉?

ainndejj11 avatar Sep 23 '22 02:09 ainndejj11

检测应该问题不大吧,如果只检测一种语言

BeyondYourself avatar Sep 23 '22 03:09 BeyondYourself

可以不用标注

在后处理时候,在判断英文的部分,给它筛除掉?

另一重保险

LDOUBLEV avatar Sep 24 '22 02:09 LDOUBLEV