MaaAssistantArknights icon indicating copy to clipboard operation
MaaAssistantArknights copied to clipboard

考虑升级 PPOCRv5

Open MistEO opened this issue 10 months ago • 6 comments

在提问之前...

  • [x] 我填写了简短且清晰明确的标题,以便开发者在翻阅 Issue 列表时能快速确定大致问题。而不是“一个建议”、“卡住了”等
  • [x] 我基本确定这是一个新功能/建议,而不是遇到了 Bug(不确定的话请附上日志)
  • [x] 我使用的是当前更新版本的最新版,且已查看版本发布至今的 更新内容Pull Requests 中尚未发布的更新内容,确认我的建议未被提及
  • [x] 我已检查了 公告活跃议题已关闭议题,确认我的建议未被提及

有什么好的想法?

官方介绍

MaaFW 转换模型 (供参考)

cc @Plumess

但是所有 ocr_replace 估计都得改(

MistEO avatar May 30 '25 19:05 MistEO

ocr_replace probably needs to be changed

Oh no

Constrat avatar May 31 '25 08:05 Constrat

Benchmark here:

Image

v5 的耗时和平均使用 VRAM 相较 v4 都有很明显的上升(不过我们目前是 v3

SherkeyXD avatar Jun 01 '25 13:06 SherkeyXD

So... Is it worth?

Constrat avatar Jun 01 '25 14:06 Constrat

稍微看了下,绝大部分的性能下降都来自于变大的 dict,因此应该也许通过微调并且缩小 dict 的方式来获得性能提升?

Update: 似乎 v4/v5 没有提供韩文支持

https://github.com/PaddlePaddle/PaddleOCR/blob/7f159145bfc6856b3d54d6c8fad56ba1e149884b/paddleocr/_pipelines/ocr.py#L297-L311

README 中也提到了

在文字类型方面,PP-OCRv5支持简体中文、中文拼音、繁体中文、英文、日文5大主流文字类型

所以要换 v5 的话需要我们自己拿数据去训练韩文的部分

SherkeyXD avatar Jun 01 '25 19:06 SherkeyXD

韩文不换呗,还用 v3

MistEO avatar Jun 04 '25 08:06 MistEO

那微调一个模型然后试试看推理延时(

SherkeyXD avatar Jun 05 '25 01:06 SherkeyXD