批处理去水印功能建议
https://www.cnblogs.com/stronghorse/p/14572080.html https://www.cnblogs.com/stronghorse/p/15789961.html https://www.cnblogs.com/stronghorse/p/16545775.html 马先生这个思路才是釜底抽薪的终极办法,用正则直接处理pdf内部数据流。
`用正则表达式对PDF文件内容进行替换
喜欢这个功能的人喜欢到骨子里,甚至有人相信这个功能无所不能;讨厌这个功能的人也能讨厌到骨子里,甚至认为这个功能根本就是个坑。而我自己为了使用这个功能,《PDF Reference》也不知道翻了多少遍。
当年和国外某PDF软件开发者讨论这个功能的时候,他直接说我开发这个功能就是在打开潘多拉的盒子,所以我相信无论是过去、现在还是将来,都不会有哪家严肃的软件公司会开发出竞品。`
他们经常用这样的正则表达式去水印,异常简单:
/Xi\d+? Do
页面流P
(为空)
原理是一样的,但是靠正则不能处理各种水印。只有采用通配符处理原始字节码才行。
另外,PDFCommander表面上是一个万能水印工具,其实本质上是一个PDF命令行编辑工具。只是对外宣传说水印方便菜鸟理解而已,毕竟你不能让菜鸟用命令行去编辑PDF。
命令行的好处是可以批量处理同一批次的PDF文档。
不见得用正则表达式匹配处理就是必由之路。 直接分析编辑内容流,对比较多用户而言还是难度颇高。 对于文本水印而言,有时候不是那么容易可以定位其内容并写出一个表达式。
测试了PdfPig,可以处理常规的PDF。修改之后的PdfPig可以输出16进制数据,可以支持查看部分文本水印。
竖排和旋转的pdf页面处理不支持。
修改itextsharp的PDFString,增加HexValue,在解析token的时候,给Value和HexValue都赋值。
这样输出Tj就可以支持字符串和16进制码了
例如你发的那个test2.pdf,输出是这样的:
PDFCommander 更新到 v1.20 基本可以应付99.9的PDF水印。最新版的删除指令段功能可以处理Contents中全部的曲线水印。 PDFToys的正则功能虽然也能删指令段,但是对普通人来说实在难以入手。PDFCommander 的 -e 参数对普通人更友好。
这个issus可以关闭了
PDFCommander 更新到 v1.20 基本可以应付99.9的PDF水印。最新版的删除指令段功能可以处理Contents中全部的曲线水印。 PDFToys的正则功能虽然也能删指令段,但是对普通人来说实在难以入手。PDFCommander 的 -e 参数对普通人更友好。
这个issus可以关闭了
请教,PDFCommander在哪里下载?
PDFCommander 更新到 v1.20 基本可以应付99.9的PDF水印。最新版的删除指令段功能可以处理Contents中全部的曲线水印。 PDFToys的正则功能虽然也能删指令段,但是对普通人来说实在难以入手。PDFCommander 的 -e 参数对普通人更友好。 这个issus可以关闭了
请教,PDFCommander在哪里下载?
https://www.52pojie.cn/thread-1943717-1-1.html