PaddleClas 语种检测准确率很差

语种识别准确率很低，是用错了吗？

issues/3317 里提到用

系统

windows 10, 64位
Python 3.11
CPU only

工具包

paddleclas 2.6.0
paddleocr 2.9.1
paddlepaddle 2.6.2

功能：

输入图片，识别语种

代码：

import paddleclas

file_name = r"E:\ocr\data\hand\3.jpg"

lang_model = paddleclas.PaddleClas(model_name="language_classification")
result = lang_model.predict(input_data=file_name)
result = list(result)
lang_type = result[0][0]['label_names'][0]
print('语言类型为：',lang_type)

随机检测5-6张图片，语种识别准确率很差，只有1个识别正确

中文截图被识别为 cyrillic 和日文

[[{'class_ids': [2, 4], 'scores': [0.20747, 0.1695], 'label_names': ['cyrillic', 'japan'], 'filename': 'E:\\ocr\\data\\a.png'}]]

英文影印版截图识别成了中文繁体、韩文

result=[[{'class_ids': [1, 6], 'scores': [0.91424, 0.01366], 'label_names': ['chinese_cht', 'korean'], 'filename': 'E:\\ocr\\data\\OCR_e2e_img\\scan.png'}]]

中文手写体识别成了拉丁文、阿拉伯文

result=[[{'class_ids': [9, 0], 'scores': [0.3635, 0.1387], 'label_names': ['latin', 'arabic'], 'filename': 'E:\\ocr\\data\\hand\\1.jpg'}]]

多语种图片（中英日法德）被识别成韩文、拉拉丁文

all

[{'class_ids': [6, 9], 'scores': [0.55042, 0.14912], 'label_names': ['korean', 'latin'], 'filename': 'E:\\ocr\\data\\all.jpg'}]

Dec 11 '24 14:12 wqw547243068

猜测，你这里测试的有问题。输入图像应该是一条条的文本行，而不是整个图像。类似下面这样：

Dec 12 '24 01:12 SWHL

猜测，你这里测试的有问题。输入图像应该是一条条的文本行，而不是整个图像。类似下面这样：

对输入图像还有限制？那实用性相当受限了

Dec 12 '24 15:12 wqw547243068

没有啊，这个的输入是文本检测模型的输出。输入一张图像，先过文本检测模型，就得到一条条的文本行图像，再送入这个模型来区分具体语种。

Dec 13 '24 00:12 SWHL

没有啊，这个的输入是文本检测模型的输出。输入一张图像，先过文本检测模型，就得到一条条的文本行图像，再送入这个模型来区分具体语种。

啊，这么用的？那语种检测的意义不大了，更加实用的场景是直接对图片进行语种预判

Dec 22 '24 12:12 wqw547243068

一张图像中存在多种语言的呢？

Dec 22 '24 12:12 SWHL

没有啊，这个的输入是文本检测模型的输出。输入一张图像，先过文本检测模型，就得到一条条的文本行图像，再送入这个模型来区分具体语种。

啊，这么用的？那语种检测的意义不大了，更加实用的场景是直接对图片进行语种预判

说真的，不懂就要多学多看...

Apr 15 '25 03:04 terrencew

从文档中可以看到，支持了很多语言，但看起来是不支持简体中文和英文识别

会给出支持语言更全的推理模型吗，还是社区有训练好的模型呢

May 24 '25 10:05 xushengfeng

从文档中可以看到，支持了很多语言，但看起来是不支持简体中文和英文识别

会给出支持语言更全的推理模型吗，还是社区有训练好的模型呢

未来这块可能会在PaddleOCR中有更好的体现，当然不知道你的目的是什么，PaddleOCR未来的模型尽可能会用单模型统一多语言

May 24 '25 15:05 cuicheng01

The issue has no response for a long time and will be closed. You can reopen or new another issue if are still confused.

From Bot

Jun 25 '25 03:06 TingquanGao

语种检测准确率很差

中文截图被识别为 cyrillic 和 日文

中文手写体识别成了 拉丁文、阿拉伯文

多语种图片（中英日法德）被识别成韩文、拉拉丁文

中文截图被识别为 cyrillic 和日文

中文手写体识别成了拉丁文、阿拉伯文