ddddocr
ddddocr copied to clipboard
set_range by int 名存实亡
https://github.com/sml2h3/ddddocr/blob/bdb2cb0faec5f0f44234e082ba04295f2cb42e0d/ddddocr/models/charset_manager.py#L94-L97 想要正确设置,只有自行输入str。另外,就算设置了 str,返回的 obj 里依然会返回完整字符集。
您的邮件已收到
对,我昨天是第一次使用dddd,使用的时候也发现这个问题了,不论是传指定的int 还是 字符串,也会识别出限制范围之外的结果
比方说,我限制 ocr.set_ranges('0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ') 或者 ocr.set_ranges(6)
最终都会把图片中的“3” 识别为 汉字“了”,而我的限制按说是不包括中文的
目前我在找更底层的函数,估计得在那个地方修改了