PDFPatcher
PDFPatcher copied to clipboard
[功能请求]支持提取PDF内嵌的字体和内嵌的文字
使用场景 例如:遇到显示文字正常,但是复制文字成乱码的PDF,怀疑此类PDF在文字字符和字体上都做了一定的处理,因此能够提取文档内的内嵌字体和文字字符,用来处理此类文档。
类似软件 没有,我试了PDF Font Extractor发现他提取字体的效果不太行
你倒是发个样本pdf啊。某些处理过的pdf是无法提取文本的,只能OCR。