语种检测准确率很差
语种识别准确率很低,是用错了吗?
issues/3317 里提到用
系统
- windows 10, 64位
- Python 3.11
- CPU only
工具包
- paddleclas 2.6.0
- paddleocr 2.9.1
- paddlepaddle 2.6.2
功能:
- 输入图片,识别语种
代码:
import paddleclas
file_name = r"E:\ocr\data\hand\3.jpg"
lang_model = paddleclas.PaddleClas(model_name="language_classification")
result = lang_model.predict(input_data=file_name)
result = list(result)
lang_type = result[0][0]['label_names'][0]
print('语言类型为:',lang_type)
随机检测5-6张图片,语种识别准确率很差,只有1个识别正确
中文截图被识别为 cyrillic 和 日文
[[{'class_ids': [2, 4], 'scores': [0.20747, 0.1695], 'label_names': ['cyrillic', 'japan'], 'filename': 'E:\\ocr\\data\\a.png'}]]
英文影印版截图识别成了 中文繁体、韩文
result=[[{'class_ids': [1, 6], 'scores': [0.91424, 0.01366], 'label_names': ['chinese_cht', 'korean'], 'filename': 'E:\\ocr\\data\\OCR_e2e_img\\scan.png'}]]
中文手写体识别成了 拉丁文、阿拉伯文
result=[[{'class_ids': [9, 0], 'scores': [0.3635, 0.1387], 'label_names': ['latin', 'arabic'], 'filename': 'E:\\ocr\\data\\hand\\1.jpg'}]]
多语种图片(中英日法德)被识别成韩文、拉拉丁文
[{'class_ids': [6, 9], 'scores': [0.55042, 0.14912], 'label_names': ['korean', 'latin'], 'filename': 'E:\\ocr\\data\\all.jpg'}]
猜测,你这里测试的有问题。输入图像应该是一条条的文本行,而不是整个图像。类似下面这样:
猜测,你这里测试的有问题。输入图像应该是一条条的文本行,而不是整个图像。类似下面这样:
对输入图像还有限制?那实用性相当受限了
没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。
没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。
啊,这么用的?那语种检测的意义不大了,更加实用的场景是直接对图片进行语种预判
一张图像中存在多种语言的呢?
没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。
啊,这么用的?那语种检测的意义不大了,更加实用的场景是直接对图片进行语种预判
说真的,不懂就要多学多看...
从文档中可以看到,支持了很多语言,但看起来是不支持简体中文和英文识别
会给出支持语言更全的推理模型吗,还是社区有训练好的模型呢
未来这块可能会在PaddleOCR中有更好的体现,当然不知道你的目的是什么,PaddleOCR未来的模型尽可能会用单模型统一多语言
The issue has no response for a long time and will be closed. You can reopen or new another issue if are still confused.
From Bot
