text-detection-ctpn icon indicating copy to clipboard operation
text-detection-ctpn copied to clipboard

测试结果不是很准确漏字,有些地方检测出框

Open woshi91 opened this issue 6 years ago • 20 comments

qq 20190223103117 qq 20190223103126

是什么原因呢?

woshi91 avatar Feb 23 '19 02:02 woshi91

I have the same issue. As listed below test3 I modify the MAX_HORIZONTAL_GAP value, if I change it to 80, the missing part can be detected. All three selections A,B,C are merged as one line. I wish they can detected seperately.

yaliqin avatar Feb 25 '19 01:02 yaliqin

@woshi91 想问下你们得模型大么?我predict得时候显示显存不够。。。

Zhangpeixiang avatar Feb 28 '19 01:02 Zhangpeixiang

@woshi91 vgg 网络的问题,建议换成resnet

luckydog5 avatar Apr 24 '19 07:04 luckydog5

同样用了vgg的底层,但是效果很不错

Zhangpeixiang avatar Apr 24 '19 07:04 Zhangpeixiang

@Zhangpeixiang pdf文本转成图片,基于vgg的检测效果很差,漏检问题比较严重,并且对与图片的size很敏感。

luckydog5 avatar Apr 24 '19 07:04 luckydog5

pdf转jpg或者png得话像素是没有损失的,至于你说的漏检问题应该是通用得模型应用到了某个场景,对于size敏感是很正常得,因为是对于提取得特征图得每一个点来生成不同得anchor,训练图片得size跟真实得预测size尽量要保持一致,我是全部resize训练得,这样loss收敛得也快,anchor学习到的regression参数也好,预测也resize到训练得尺寸。

Zhangpeixiang avatar Apr 24 '19 07:04 Zhangpeixiang

@luckydog5

Zhangpeixiang avatar Apr 24 '19 07:04 Zhangpeixiang

@luckydog5 CTPN底层改成resnet理论上确实提取得特征会更好,但是我觉得vgg就已经可以取得不错得效果了~

Zhangpeixiang avatar Apr 24 '19 07:04 Zhangpeixiang

@Zhangpeixiang 因为我在实际测试的时候,即使把图片 resize 到和训练样本相同,依然会存在漏字的情况,并且存在把单个字切开的情况,这严重影响了后续的识别过程。resent有很大的改进,漏字情况较少。

luckydog5 avatar Apr 24 '19 07:04 luckydog5

@luckydog5 应该不会吧,我最近做的工程项目中就是用的CTPN,对于拍照、扫描、电子版的照片识别效果都不错,可能你训练的样本不够吧,标签不好?把单个字切断这个是因为你得阈值的设置,太高了就容易将一些anchor cut掉,导致最终的proposal显示的文字不全,漏字这个情况应该是你没有用测试的场景本文进行训练导致的问题。

Zhangpeixiang avatar Apr 24 '19 08:04 Zhangpeixiang

@Zhangpeixiang 有道理,我改一下。 🙏

luckydog5 avatar Apr 24 '19 08:04 luckydog5

@luckydog5 感觉preprocessing很重要。可以针对性的做一些preprocessing,对于之后的CRNN预测也很好

Zhangpeixiang avatar Apr 24 '19 08:04 Zhangpeixiang

楼上大佬好,是否愿意帮我们做个文本检测项目哈:)有偿

loooong avatar May 14 '19 14:05 loooong

@loooong 最近整好在做这方面的项目,已经有不错的效果了,可以做一下任务迁移,qq1321444999

Zhangpeixiang avatar May 15 '19 01:05 Zhangpeixiang

@luckydog5 应该不会吧,我最近做的工程项目中就是用的CTPN,对于拍照、扫描、电子版的照片识别效果都不错,可能你训练的样本不够吧,标签不好?把单个字切断这个是因为你得阈值的设置,太高了就容易将一些anchor cut掉,导致最终的proposal显示的文字不全,漏字这个情况应该是你没有用测试的场景本文进行训练导致的问题。

你好,我最近也是检测出有漏字的情况,一般是修改什么参数呢?阈值设置大一些好还是小一些好?

rechardchen123 avatar Jun 13 '19 16:06 rechardchen123

@rechardchen123 检查你的训练样本,标注是否准确,阈值可以适当小一些,另外如果单张图中文本较多,相应增加proposal的数目。

luckydog5 avatar Jun 19 '19 11:06 luckydog5

楼上大佬好,是否愿意帮我们做个文本检测项目哈:)有偿

刚好做了一个这个方面的项目,感兴趣可以加我微信。davidcommander

rechardchen123 avatar Jun 19 '19 13:06 rechardchen123

多少

------------------ 原始邮件 ------------------ 发件人: "notifications"[email protected]; 发送时间: 2019年6月19日(星期三) 晚上9:52 收件人: "eragonruan/text-detection-ctpn"[email protected]; 抄送: "Subscribed"[email protected]; 主题: Re: [eragonruan/text-detection-ctpn] 测试结果不是很准确漏字,有些地方检测出框 (#300)

楼上大佬好,是否愿意帮我们做个文本检测项目哈:)有偿

刚好做了一个这个方面的项目,感兴趣可以加我微信。davidcommander

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or mute the thread.

2017TJM avatar Jun 19 '19 13:06 2017TJM

你好 @rechardchen123 请问可以咨询下ctpn项目相关的吗

qingqing625 avatar Jul 10 '20 09:07 qingqing625

您好,需要咨询什么哈

在 2020-07-10 17:07:33,"Sunflower" [email protected] 写道:

你好 @rechardchen123 请问可以咨询下ctpn项目相关的吗

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

loooong avatar Jul 11 '20 14:07 loooong