Feature Request: ysgyolo检测后,文字去除效果的优化【已初步优化,待提升】
版本信息
D:\OCR\BallonsTranslator-官网\launch.py:8: DeprecationWarning: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html
import pkg_resources
Python version: 3.10.11 (tags/v3.10.11:7d4cc5a, Apr 5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)]
Python executable: D:\OCR\BallonsTranslator-官网\ballontrans_pylibs_win\python.exe
Version: 1.4.0
Branch: dev
Commit hash:
测试原图:
描述
相比于之前已经有很大提升,但还比不上ctd,而且不知道为什么我这边会漏掉一些正文…… 使用的默认参数,膨胀值都为5,前后对比,大家可以测试一下~ 通过网盘分享的文件:ysgyolo修复效果优化 百度网盘: https://pan.baidu.com/s/1jDVdQZ1RDnS8aWOG6Fx92A?pwd=5057 提取码: 5057
https://github.com/user-attachments/assets/191ddfb4-3749-4b64-9393-f6d3116c3478
https://github.com/user-attachments/assets/90f042e7-19b9-4a55-be5d-f492017fc8ee
直接 fork 一份把代码传那里会不会方便点
这边建议 如果你想验证模型 我非常推荐使用 更专业的 标注工具 https://github.com/CVHub520/X-AnyLabeling 来进行交叉验证 这样你可以确定是模型本身 识别的就垃圾 还是在BL里的设置问题 并且可以使用脚本 直接将X-AnyLabeling 的JSON无缝转换成BL的JSON 然后进行后续的OCR或其他操作 然后既然都 用标注软件了 何不直接导出数据训练一波 3万张以下 家用消费机显卡可以轻松训练 BL的数据也可以直接转化成YOLO或者COCO目标检测格式的文件直接进行训练
确实有效了不少,但是使用过程中 比起原版,保存图片的时候卡顿会比较严重···?
确实有效了不少,但是使用过程中 比起原版,保存图片的时候卡顿会比较严重···?
不是会自动保存么?切换到下一张图就自动保存了,后面再保存跟这个修复就没关系了,也只改了修复的部分代码,其他的没动
提个PR吧