GapTree_Sort_Algorithm
GapTree_Sort_Algorithm copied to clipboard
【间隙·树·排序算法】 对OCR结果或PDF提取的文本进行版面分析,按人类阅读顺序进行排序。
Results
2
GapTree_Sort_Algorithm issues
Sort by
recently updated
recently updated
newest added
及时更新/笑哭
2
从Umi-OCR过来的,发现分段、分行、分几栏的功能很好,但是在这边发现好像没有更新,直接抽取Umi-OCR的相关功能发现太难了,所以来拜托博主同步更新下这些功能。
在_get_units方法里,这段代码的必要性是什么呢? 发现这个会导致打乱原有百度ocr里的顺序,导致分行错误