PDFPatcher 批处理去水印功能建议

Enfocus Pitstop的操作逻辑太过复杂，软件体积也太大，不适合补丁丁的实现

可以参考一下这个PDF工具箱的操作逻辑：PDF去水印

批量去水印的功能需求应该是蛮大的

May 25 '24 14:05 lon91ong

https://www.cnblogs.com/stronghorse/p/14572080.html https://www.cnblogs.com/stronghorse/p/15789961.html https://www.cnblogs.com/stronghorse/p/16545775.html 马先生这个思路才是釜底抽薪的终极办法，用正则直接处理pdf内部数据流。

`用正则表达式对PDF文件内容进行替换

喜欢这个功能的人喜欢到骨子里，甚至有人相信这个功能无所不能；讨厌这个功能的人也能讨厌到骨子里，甚至认为这个功能根本就是个坑。而我自己为了使用这个功能，《PDF Reference》也不知道翻了多少遍。

当年和国外某PDF软件开发者讨论这个功能的时候，他直接说我开发这个功能就是在打开潘多拉的盒子，所以我相信无论是过去、现在还是将来，都不会有哪家严肃的软件公司会开发出竞品。`

他们经常用这样的正则表达式去水印，异常简单： /Xi\d+? Do 页面流P （为空）

Jun 02 '24 16:06 lforlgg

原理是一样的，但是靠正则不能处理各种水印。只有采用通配符处理原始字节码才行。

另外，PDFCommander表面上是一个万能水印工具，其实本质上是一个PDF命令行编辑工具。只是对外宣传说水印方便菜鸟理解而已，毕竟你不能让菜鸟用命令行去编辑PDF。

命令行的好处是可以批量处理同一批次的PDF文档。

Oct 02 '24 04:10 Charltsing

最理想的是做文档分析，并输出。类似上面的图。这是用PdfPig输出的文本信息，但是它不能输出原始字节码。

Oct 02 '24 08:10 Charltsing

不见得用正则表达式匹配处理就是必由之路。直接分析编辑内容流，对比较多用户而言还是难度颇高。对于文本水印而言，有时候不是那么容易可以定位其内容并写出一个表达式。

Oct 02 '24 10:10 wmjordan

测试了PdfPig，可以处理常规的PDF。修改之后的PdfPig可以输出16进制数据，可以支持查看部分文本水印。

竖排和旋转的pdf页面处理不支持。

Oct 02 '24 16:10 Charltsing

修改itextsharp的PDFString，增加HexValue，在解析token的时候，给Value和HexValue都赋值。

这样输出Tj就可以支持字符串和16进制码了

例如你发的那个test2.pdf，输出是这样的：

Oct 10 '24 12:10 Charltsing

PDFCommander 更新到 v1.20 基本可以应付99.9的PDF水印。最新版的删除指令段功能可以处理Contents中全部的曲线水印。 PDFToys的正则功能虽然也能删指令段，但是对普通人来说实在难以入手。PDFCommander 的 -e 参数对普通人更友好。

这个issus可以关闭了

Oct 31 '24 10:10 Charltsing

PDFCommander 更新到 v1.20 基本可以应付99.9的PDF水印。最新版的删除指令段功能可以处理Contents中全部的曲线水印。 PDFToys的正则功能虽然也能删指令段，但是对普通人来说实在难以入手。PDFCommander 的 -e 参数对普通人更友好。

这个issus可以关闭了

请教，PDFCommander在哪里下载？

Apr 27 '25 08:04 glxhenan

PDFCommander 更新到 v1.20 基本可以应付99.9的PDF水印。最新版的删除指令段功能可以处理Contents中全部的曲线水印。 PDFToys的正则功能虽然也能删指令段，但是对普通人来说实在难以入手。PDFCommander 的 -e 参数对普通人更友好。这个issus可以关闭了

请教，PDFCommander在哪里下载？

https://www.52pojie.cn/thread-1943717-1-1.html

Apr 27 '25 08:04 Charltsing