text-detection-ctpn
text-detection-ctpn copied to clipboard
测试结果不是很准确漏字,有些地方检测出框
是什么原因呢?
I have the same issue. As listed below
I modify the MAX_HORIZONTAL_GAP value, if I change it to 80, the missing part can be detected. All three selections A,B,C are merged as one line. I wish they can detected seperately.
@woshi91 想问下你们得模型大么?我predict得时候显示显存不够。。。
@woshi91 vgg 网络的问题,建议换成resnet
同样用了vgg的底层,但是效果很不错
@Zhangpeixiang pdf文本转成图片,基于vgg的检测效果很差,漏检问题比较严重,并且对与图片的size很敏感。
pdf转jpg或者png得话像素是没有损失的,至于你说的漏检问题应该是通用得模型应用到了某个场景,对于size敏感是很正常得,因为是对于提取得特征图得每一个点来生成不同得anchor,训练图片得size跟真实得预测size尽量要保持一致,我是全部resize训练得,这样loss收敛得也快,anchor学习到的regression参数也好,预测也resize到训练得尺寸。
@luckydog5
@luckydog5 CTPN底层改成resnet理论上确实提取得特征会更好,但是我觉得vgg就已经可以取得不错得效果了~
@Zhangpeixiang 因为我在实际测试的时候,即使把图片 resize 到和训练样本相同,依然会存在漏字的情况,并且存在把单个字切开的情况,这严重影响了后续的识别过程。resent有很大的改进,漏字情况较少。
@luckydog5 应该不会吧,我最近做的工程项目中就是用的CTPN,对于拍照、扫描、电子版的照片识别效果都不错,可能你训练的样本不够吧,标签不好?把单个字切断这个是因为你得阈值的设置,太高了就容易将一些anchor cut掉,导致最终的proposal显示的文字不全,漏字这个情况应该是你没有用测试的场景本文进行训练导致的问题。
@Zhangpeixiang 有道理,我改一下。 🙏
@luckydog5 感觉preprocessing很重要。可以针对性的做一些preprocessing,对于之后的CRNN预测也很好
楼上大佬好,是否愿意帮我们做个文本检测项目哈:)有偿
@loooong 最近整好在做这方面的项目,已经有不错的效果了,可以做一下任务迁移,qq1321444999
@luckydog5 应该不会吧,我最近做的工程项目中就是用的CTPN,对于拍照、扫描、电子版的照片识别效果都不错,可能你训练的样本不够吧,标签不好?把单个字切断这个是因为你得阈值的设置,太高了就容易将一些anchor cut掉,导致最终的proposal显示的文字不全,漏字这个情况应该是你没有用测试的场景本文进行训练导致的问题。
你好,我最近也是检测出有漏字的情况,一般是修改什么参数呢?阈值设置大一些好还是小一些好?
@rechardchen123 检查你的训练样本,标注是否准确,阈值可以适当小一些,另外如果单张图中文本较多,相应增加proposal的数目。
楼上大佬好,是否愿意帮我们做个文本检测项目哈:)有偿
刚好做了一个这个方面的项目,感兴趣可以加我微信。davidcommander
多少
------------------ 原始邮件 ------------------ 发件人: "notifications"[email protected]; 发送时间: 2019年6月19日(星期三) 晚上9:52 收件人: "eragonruan/text-detection-ctpn"[email protected]; 抄送: "Subscribed"[email protected]; 主题: Re: [eragonruan/text-detection-ctpn] 测试结果不是很准确漏字,有些地方检测出框 (#300)
楼上大佬好,是否愿意帮我们做个文本检测项目哈:)有偿
刚好做了一个这个方面的项目,感兴趣可以加我微信。davidcommander
— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or mute the thread.
你好 @rechardchen123 请问可以咨询下ctpn项目相关的吗
您好,需要咨询什么哈
在 2020-07-10 17:07:33,"Sunflower" [email protected] 写道:
你好 @rechardchen123 请问可以咨询下ctpn项目相关的吗
— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.