Charltsing.Liu
Charltsing.Liu
确实在图纸文件中见过5万宽高的图像,Bitmap格式内存流无法处理。也许需要使用文件流。
i update the code PdfPig-master\src\UglyToad.PdfPig\Graphics\ContentStreamProcessor.cs  [Letter.zip](https://github.com/user-attachments/files/17268647/Letter.zip)
Because it's been too long, I can't remember my specific thoughts back then. Perhaps it is hoped that the Letter class can add the cmap attribute, so that cmap and...
https://github.com/Charltsing/Leptonica-binaries-for-windows
https://github.com/liole/PicturesqueEditor I guess your problem may lie in the brush code. If you have time, you can take a look at this
PDF 里画实心矩形的运算符只有 4 个: x y width height re - 把矩形压到路径里 g(或 G) - 设灰度颜色,0=黑 f(或 `f*) - 用当前颜色填充路径 下面给出最小可运行代码,画一个左上角 (100,700)、宽 80、高 40 的黑色矩形。 stream.Write("100 700 80 40 re\n0 g\nf\n");...
你倒是发个样本pdf啊。某些处理过的pdf是无法提取文本的,只能OCR。
想起个事,在2024年12月,agl 讨论了分类器错误的问题,修改了默认的阈值和权重,应该显著减缓了文本字符编码造成的错误归类的问题。[参见这个讨论]( https://github.com/agl/jbig2enc/commit/f1edbd89944910672d6759aecb999f9c34132e98) 所以,也许可以考虑在通用无损编码之外,增加文本区域编码,做个可选项。唯一的问题是,需要加入Leptonica或者别的什么分类器的依赖,可能不值得。 顺便提供一个我编译好的jbig2.exe供测试,agl的 [jbig2-0.30-Win32.zip](https://github.com/user-attachments/files/23795955/jbig2-0.30-Win32.zip) 
> 无法重现故障。 > 1.2.0.4683 不报错误。 我下载github最新版也是三天前的,报错。大概还没更新? 
1.2.0.4678 版,点击XObject--X25--命令--第二个绘图状态--文本区--字符串(TJ),这里的字符串4678和4683版都没有解析它 我估计因为字体错误把这句操作符跳过去了  这个是github当前版本提示的错误 