PaddleClas icon indicating copy to clipboard operation
PaddleClas copied to clipboard

语种检测准确率很差

Open wqw547243068 opened this issue 1 year ago • 8 comments

语种识别准确率很低,是用错了吗?

issues/3317 里提到用

系统

  • windows 10, 64位
  • Python 3.11
  • CPU only

工具包

  • paddleclas 2.6.0
  • paddleocr 2.9.1
  • paddlepaddle 2.6.2

功能:

  • 输入图片,识别语种

代码:

import paddleclas

file_name = r"E:\ocr\data\hand\3.jpg"

lang_model = paddleclas.PaddleClas(model_name="language_classification")
result = lang_model.predict(input_data=file_name)
result = list(result)
lang_type = result[0][0]['label_names'][0]
print('语言类型为:',lang_type)

随机检测5-6张图片,语种识别准确率很差,只有1个识别正确

中文截图被识别为 cyrillic 和 日文

a

[[{'class_ids': [2, 4], 'scores': [0.20747, 0.1695], 'label_names': ['cyrillic', 'japan'], 'filename': 'E:\\ocr\\data\\a.png'}]]

英文影印版截图识别成了 中文繁体、韩文

  • scan
result=[[{'class_ids': [1, 6], 'scores': [0.91424, 0.01366], 'label_names': ['chinese_cht', 'korean'], 'filename': 'E:\\ocr\\data\\OCR_e2e_img\\scan.png'}]]

中文手写体识别成了 拉丁文、阿拉伯文

01

result=[[{'class_ids': [9, 0], 'scores': [0.3635, 0.1387], 'label_names': ['latin', 'arabic'], 'filename': 'E:\\ocr\\data\\hand\\1.jpg'}]]

多语种图片(中英日法德)被识别成韩文、拉拉丁文

all

[{'class_ids': [6, 9], 'scores': [0.55042, 0.14912], 'label_names': ['korean', 'latin'], 'filename': 'E:\\ocr\\data\\all.jpg'}]

wqw547243068 avatar Dec 11 '24 14:12 wqw547243068

猜测,你这里测试的有问题。输入图像应该是一条条的文本行,而不是整个图像。类似下面这样:

image

SWHL avatar Dec 12 '24 01:12 SWHL

猜测,你这里测试的有问题。输入图像应该是一条条的文本行,而不是整个图像。类似下面这样:

image

对输入图像还有限制?那实用性相当受限了

wqw547243068 avatar Dec 12 '24 15:12 wqw547243068

没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。

SWHL avatar Dec 13 '24 00:12 SWHL

没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。

啊,这么用的?那语种检测的意义不大了,更加实用的场景是直接对图片进行语种预判

wqw547243068 avatar Dec 22 '24 12:12 wqw547243068

一张图像中存在多种语言的呢?

SWHL avatar Dec 22 '24 12:12 SWHL

没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。

啊,这么用的?那语种检测的意义不大了,更加实用的场景是直接对图片进行语种预判

说真的,不懂就要多学多看...

terrencew avatar Apr 15 '25 03:04 terrencew

文档中可以看到,支持了很多语言,但看起来是不支持简体中文和英文识别

会给出支持语言更全的推理模型吗,还是社区有训练好的模型呢

xushengfeng avatar May 24 '25 10:05 xushengfeng

文档中可以看到,支持了很多语言,但看起来是不支持简体中文和英文识别

会给出支持语言更全的推理模型吗,还是社区有训练好的模型呢

未来这块可能会在PaddleOCR中有更好的体现,当然不知道你的目的是什么,PaddleOCR未来的模型尽可能会用单模型统一多语言

cuicheng01 avatar May 24 '25 15:05 cuicheng01

The issue has no response for a long time and will be closed. You can reopen or new another issue if are still confused.


From Bot

TingquanGao avatar Jun 25 '25 03:06 TingquanGao