ddddocr icon indicating copy to clipboard operation
ddddocr copied to clipboard

目标检测只能返回坐标,可以返回识别出的对象的内容嘛

Open cyqresig opened this issue 1 year ago • 6 comments

网易点选汉字

如上图,请问现在最新的 1.4.0 版本,看文档介绍,目标检测只能返回坐标, 有没有办法将识别出的对象的内容也返回出来?(比如文字或图形符号)

poses = det.detection(image)

print(poses)

[[0, 345, 30, 376], [28, 346, 59, 378], [57, 345, 88, 375], [2, 181, 67, 250], [121, 163, 188, 229], [223, 119, 291, 187]]

以上为尝试 API 的返回结果,目前识别成功后,只能返回坐标

cyqresig avatar Dec 20 '23 08:12 cyqresig

同问 @kerlomz

BadDeveloper2022 avatar Feb 17 '24 07:02 BadDeveloper2022

+1

alair074 avatar Mar 11 '24 04:03 alair074

您好,请问有解决方案吗?

chengxiang123aa avatar Apr 25 '24 09:04 chengxiang123aa

先识别出对象,再切图进行文字识别

zixing131 avatar Apr 26 '24 05:04 zixing131

先识别出对象,再切图进行文字识别

你好,我尝试过,我觉得ddddocr的目标检测做的很好,位置信息识别很准,但是识别的文字效果太差,根据位置信息切分出来的图片基本不能识别正确。不知道你有没有什么比较好的解决方案,还是说得自己去训练推理模型呢。

chengxiang123aa avatar Apr 27 '24 09:04 chengxiang123aa

先识别出对象,再切图进行文字识别

你好,我尝试过,我觉得ddddocr的目标检测做的很好,位置信息识别很准,但是识别的文字效果太差,根据位置信息切分出来的图片基本不能识别正确。不知道你有没有什么比较好的解决方案,还是说得自己去训练推理模型呢。

你这个文字被旋转变形了,可以自己预处理一下文字然后自己训练或者尝试直接对比文字图像,用图像对比的算法

zixing131 avatar Apr 28 '24 07:04 zixing131