PDFPatcher
PDFPatcher copied to clipboard
编译64位的JBig2库,考虑引入有损编码。
x64位需要参考Win32的项目属性设置,修改如下: 1、常规-输出目录改为$(SolutionDir)bin$(Configuration)$(Platform)\,配置类型改为动态库 2、补齐vc++目录包含目录定义 3、C/C++预处理器定义 4、链接器-输入,附加依赖项、模块定义文件
5、修改源代码中的数据类型转换错误(改成size_t,还有几处常量处理 )
有时间可以改一下
想起个事,在2024年12月,agl 讨论了分类器错误的问题,修改了默认的阈值和权重,应该显著减缓了文本字符编码造成的错误归类的问题。参见这个讨论
所以,也许可以考虑在通用无损编码之外,增加文本区域编码,做个可选项。唯一的问题是,需要加入Leptonica或者别的什么分类器的依赖,可能不值得。
顺便提供一个我编译好的jbig2.exe供测试,agl的
MuPDF库里面也使用Leptonica。如果后面调整这个编码库,可考虑将它合并到MuPDF的动态链接库里,这样就可以复用Leptonica库,引入有损编码功能。