MaaAssistantArknights 考虑升级 PPOCRv5

cc @Plumess

但是所有 ocr_replace 估计都得改（

May 30 '25 19:05 MistEO

ocr_replace probably needs to be changed

Oh no

May 31 '25 08:05 Constrat

Benchmark here：

v5 的耗时和平均使用 VRAM 相较 v4 都有很明显的上升（不过我们目前是 v3

Jun 01 '25 13:06 SherkeyXD

So... Is it worth?

Jun 01 '25 14:06 Constrat

稍微看了下，绝大部分的性能下降都来自于变大的 dict，因此应该也许通过微调并且缩小 dict 的方式来获得性能提升？

Update: 似乎 v4/v5 没有提供韩文支持

https://github.com/PaddlePaddle/PaddleOCR/blob/7f159145bfc6856b3d54d6c8fad56ba1e149884b/paddleocr/_pipelines/ocr.py#L297-L311

README 中也提到了

在文字类型方面，PP-OCRv5支持简体中文、中文拼音、繁体中文、英文、日文5大主流文字类型

所以要换 v5 的话需要我们自己拿数据去训练韩文的部分

Jun 01 '25 19:06 SherkeyXD

韩文不换呗，还用 v3

Jun 04 '25 08:06 MistEO

那微调一个模型然后试试看推理延时（

Jun 05 '25 01:06 SherkeyXD