BallonsTranslator icon indicating copy to clipboard operation
BallonsTranslator copied to clipboard

Feature Request: ysgyolo检测后,文字去除效果的优化【已初步优化,待提升】

Open 505728366 opened this issue 5 months ago • 5 comments

版本信息

D:\OCR\BallonsTranslator-官网\launch.py:8: DeprecationWarning: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html import pkg_resources Python version: 3.10.11 (tags/v3.10.11:7d4cc5a, Apr 5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)] Python executable: D:\OCR\BallonsTranslator-官网\ballontrans_pylibs_win\python.exe Version: 1.4.0 Branch: dev Commit hash: Device name: NVIDIA GeForce RTX 4070 Cuda is available: True

测试原图: Image Image

描述

相比于之前已经有很大提升,但还比不上ctd,而且不知道为什么我这边会漏掉一些正文…… 使用的默认参数,膨胀值都为5,前后对比,大家可以测试一下~ 通过网盘分享的文件:ysgyolo修复效果优化 百度网盘: https://pan.baidu.com/s/1jDVdQZ1RDnS8aWOG6Fx92A?pwd=5057 提取码: 5057

https://github.com/user-attachments/assets/191ddfb4-3749-4b64-9393-f6d3116c3478

https://github.com/user-attachments/assets/90f042e7-19b9-4a55-be5d-f492017fc8ee

505728366 avatar Jul 13 '25 17:07 505728366

直接 fork 一份把代码传那里会不会方便点

dmMaze avatar Jul 14 '25 06:07 dmMaze

这边建议 如果你想验证模型 我非常推荐使用 更专业的 标注工具 https://github.com/CVHub520/X-AnyLabeling 来进行交叉验证 这样你可以确定是模型本身 识别的就垃圾 还是在BL里的设置问题 并且可以使用脚本 直接将X-AnyLabeling 的JSON无缝转换成BL的JSON 然后进行后续的OCR或其他操作 然后既然都 用标注软件了 何不直接导出数据训练一波 3万张以下 家用消费机显卡可以轻松训练 BL的数据也可以直接转化成YOLO或者COCO目标检测格式的文件直接进行训练

lhj5426 avatar Jul 14 '25 09:07 lhj5426

确实有效了不少,但是使用过程中 比起原版,保存图片的时候卡顿会比较严重···?

mengyiyongjiu avatar Jul 31 '25 14:07 mengyiyongjiu

确实有效了不少,但是使用过程中 比起原版,保存图片的时候卡顿会比较严重···?

不是会自动保存么?切换到下一张图就自动保存了,后面再保存跟这个修复就没关系了,也只改了修复的部分代码,其他的没动

505728366 avatar Jul 31 '25 18:07 505728366

提个PR吧

youmengjia2002 avatar Aug 06 '25 09:08 youmengjia2002