kbase-doc icon indicating copy to clipboard operation
kbase-doc copied to clipboard

如何提取水印?

Open XinwenXiang opened this issue 1 year ago • 4 comments

您好,查看了您对于pdf文件嵌入的源码,请问是否有对应提取水印的方法?

XinwenXiang avatar Apr 24 '23 09:04 XinwenXiang

@XinwenXiang 你好,请问是提取水印,还是移除水印,如果是移除水印,我google了下,pdfbox 应该可以移除图片或文本水印,如果是提取水印,是提取为图片,还是文本呢?

ekoz avatar Apr 25 '23 06:04 ekoz

您好,是提取水印,想要提取水印的文本信息。 项目逻辑应该是addWaterMark中可以设置嵌入的水印信息(我这边暂时只考虑文本信息),但是缺少一个对应的extractWaterMark()处理,我看到有些用python实现的代码库,但是Java还没找到一个较为合适的。

XinwenXiang avatar Apr 25 '23 12:04 XinwenXiang

@XinwenXiang pdf 添加文本水印,其实是通过文本生成一张图片,再把图片调用 itextpdf PdfStamper 方法生成水印,提取文本我还没有思路,itextpdf 好像没有提供方法。如果 python 来实现,是 ocr 提取文本么?找到一篇相关论文:https://patents.google.com/patent/CN107194390A/zh

ekoz avatar Apr 26 '23 07:04 ekoz

您好,看了下Java的Itext 这些开源仓库,在嵌入水印的时候可以设置文本信息但是没有对应的提取(此部分我还需要再学习下),这篇专利看起来没有代码,能参考的不多。感谢您的回复和帮助!

XinwenXiang avatar Apr 27 '23 03:04 XinwenXiang