考虑升级 PPOCRv5
在提问之前...
- [x] 我填写了简短且清晰明确的标题,以便开发者在翻阅 Issue 列表时能快速确定大致问题。而不是“一个建议”、“卡住了”等
- [x] 我基本确定这是一个新功能/建议,而不是遇到了 Bug(不确定的话请附上日志)
- [x] 我使用的是当前更新版本的最新版,且已查看版本发布至今的 更新内容 和 Pull Requests 中尚未发布的更新内容,确认我的建议未被提及
- [x] 我已检查了 公告、活跃议题、已关闭议题,确认我的建议未被提及
有什么好的想法?
MaaFW 转换模型 (供参考)
cc @Plumess
但是所有 ocr_replace 估计都得改(
ocr_replace probably needs to be changed
Oh no
Benchmark here:
v5 的耗时和平均使用 VRAM 相较 v4 都有很明显的上升(不过我们目前是 v3
So... Is it worth?
稍微看了下,绝大部分的性能下降都来自于变大的 dict,因此应该也许通过微调并且缩小 dict 的方式来获得性能提升?
Update: 似乎 v4/v5 没有提供韩文支持
https://github.com/PaddlePaddle/PaddleOCR/blob/7f159145bfc6856b3d54d6c8fad56ba1e149884b/paddleocr/_pipelines/ocr.py#L297-L311
README 中也提到了
在文字类型方面,PP-OCRv5支持简体中文、中文拼音、繁体中文、英文、日文5大主流文字类型
所以要换 v5 的话需要我们自己拿数据去训练韩文的部分
韩文不换呗,还用 v3
那微调一个模型然后试试看推理延时(