BallonsTranslator Feature Request: ysgyolo检测后，文字去除效果的优化【已初步优化，待提升】

版本信息

D:\OCR\BallonsTranslator-官网\launch.py:8: DeprecationWarning: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html import pkg_resources Python version: 3.10.11 (tags/v3.10.11:7d4cc5a, Apr 5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)] Python executable: D:\OCR\BallonsTranslator-官网\ballontrans_pylibs_win\python.exe Version: 1.4.0 Branch: dev Commit hash: Device name: NVIDIA GeForce RTX 4070 Cuda is available: True

测试原图：

描述

相比于之前已经有很大提升，但还比不上ctd，而且不知道为什么我这边会漏掉一些正文…… 使用的默认参数，膨胀值都为5，前后对比，大家可以测试一下~ 通过网盘分享的文件：ysgyolo修复效果优化百度网盘: https://pan.baidu.com/s/1jDVdQZ1RDnS8aWOG6Fx92A?pwd=5057 提取码: 5057

https://github.com/user-attachments/assets/191ddfb4-3749-4b64-9393-f6d3116c3478

https://github.com/user-attachments/assets/90f042e7-19b9-4a55-be5d-f492017fc8ee

Jul 13 '25 17:07 505728366

直接 fork 一份把代码传那里会不会方便点

Jul 14 '25 06:07 dmMaze

这边建议如果你想验证模型我非常推荐使用更专业的标注工具 https://github.com/CVHub520/X-AnyLabeling 来进行交叉验证这样你可以确定是模型本身识别的就垃圾还是在BL里的设置问题并且可以使用脚本直接将X-AnyLabeling 的JSON无缝转换成BL的JSON 然后进行后续的OCR或其他操作然后既然都用标注软件了何不直接导出数据训练一波 3万张以下家用消费机显卡可以轻松训练 BL的数据也可以直接转化成YOLO或者COCO目标检测格式的文件直接进行训练

Jul 14 '25 09:07 lhj5426

确实有效了不少，但是使用过程中比起原版，保存图片的时候卡顿会比较严重···？

Jul 31 '25 14:07 mengyiyongjiu

确实有效了不少，但是使用过程中比起原版，保存图片的时候卡顿会比较严重···？

不是会自动保存么？切换到下一张图就自动保存了，后面再保存跟这个修复就没关系了，也只改了修复的部分代码，其他的没动

Jul 31 '25 18:07 505728366

提个PR吧

Aug 06 '25 09:08 youmengjia2002