lforlgg

Results 48 comments of lforlgg

> > 把这组件独立出来,单独做一个这样的pdf管理器工具 > > 工程量较大,后续考虑下 > > > 单独设定过的页码范围在列表中显亮,以示区分 > > 设置颜色有点麻烦,我想了想,改成这样: > > * ”范围“ 栏改为 ”页数“ > * 如果用户没有设定OCR范围,则该栏显示 **总页数** > * 如果设定了范围,则显示范围 > > ![image](https://private-user-images.githubusercontent.com/56373419/335994069-80961bb1-6338-4747-bda5-91704295a65a.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MTc0MDM4MTYsIm5iZiI6MTcxNzQwMzUxNiwicGF0aCI6Ii81NjM3MzQxOS8zMzU5OTQwNjktODA5NjFiYjEtNjMzOC00NzQ3LWJkYTUtOTE3MDQyOTVhNjVhLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA2MDMlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwNjAzVDA4MzE1NlomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTlmZWIwMjFlYjFjYzFlNDJiMDIwZjZlYWQ4YmFiZjdjN2U0MDI3MWEzMjUwYTk3MTRhNWM2MWRjNjkxMzliMDMmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.ZPAEtuEN8lGXa4KY3_0nO8IIKcD4QuC_oHxHZf10H3s) >...

> 反馈收到。我们的排版解析是基于文章排版设计的。对于题册这类含大量不规则元素的排版,确实会干扰到排序算法。未来会继续优化。 感谢,去除下方大部分内容,竟然就不颠倒了,有点意思,没想到会受到后面那么远的内容倒过来影响顺序... [test-版面排版测试2(这样的版面ocr出来排版正常).pdf](https://github.com/user-attachments/files/16946425/test-.2.ocr.pdf) ![test2_ziped](https://github.com/user-attachments/assets/d84adc3c-95bb-49cb-8f64-8cc3209bb7c0)

> > 7. 修改了书签对应的页码,回车后,可否跳转到下一个书签的页码上? > > 下个版本实现了完成页码编辑操作后激活下一个书签的页码编辑框功能。 > > > 每个pdf,都要输入“序”、“前言”这样的文字 > 我刚测试了,这种属于新人想法,实际很麻烦的。真正的需求都是:改了页码后,想点一下,看看效果是否符合预期。 如果盲目自动往下跳,改动多了以后,总有疏漏三几条。这时,再回头去一一检查耗时巨大。还不如当时,编辑完,当即看看效果(这时候不能跳走)。 所以自动跳下一个这个需求,如果的确要加,以选项形式自定义勾选(默认别选中)。 其实,按学excel那样编辑完,按回车才往下跳,还有点意思。 他这种想法属于刚刚接触使用补丁丁,没用几次经验的拍脑袋想法。

> @lforlgg 我觉得 @retsyo 的建议有道理。 改过页码后,观察左边书签栏上显示的页码,会看到页码变更了,表示更改成功。 书签的跳转目标位置,就是当前阅读器上沿所在的位置,通常都不需要“点一下”确认的。 > > 下一个版本会增加快捷键,在阅读器内: 按住Shift+上或Shift+下分别可以控制书签栏,选中上一个或下一个书签。 按住Ctrl+Shift+W会更改当前选中书签的位置,并自动选择下一个书签。 看页面内容定位观察对照是否改变准确。数字是无意义的、枯燥不直观的,真正目的是对准内容页。 其实真实需求更多是,当把目录页从第3页改为第5页的时候,值改变,当即刷新右侧的页面内容显示(目前不是)。 而非马上直接跳走。 原来那样更符合日常使用。

> @lforlgg 我刚看错了,以为是针对第8条需求。 这个所谓的:“快捷键,将当前pdf页面所在页码,赋值给当前书签项目的下一个项目;并选中新书签项目” 在无数实践中没有多大的意义,一般一个章节的开始对应一个书签,而下一个书签跟上一个书签对应于同页的概率极其低。 因为第一个书签后面总有内容这些内容大多数占好几页了(偏离值0~上百不等),赋值给下个书签还是得改。 复制给下一个书签,也一样需要改动,起不到提效的作用的。 相对而言,我之前提过的一个情节,倒是有意义的: ✅一键复制已选中的项目的下方的页码上来(连输入都省了,也不用弹窗) 这种情况来自于,有不少目录,在真正的篇章之前,喜欢插入没啥内容(一个画面一个大标题之类的)的过度页,对应到目录中它干脆不列页码。 那么我们ocr目录获得了刑如: 第一部分.......无页码。 第1章.......P118这样的页码。 自然想高效获得最接近有页码的章节,那就是把第一章的页码赋值给第一部分(概率覆盖偏移值0~2页,很少有更特殊)。这个有点意义的。 其实我建议新用户不急于提新建议,先弄熟了已经有的功能设置,用它一个半年以后,了解了用通了,编辑了有几百上千个文档再来。 感觉的确好用,然后准备坚持用了:感觉捐助一个50~200的也值!就开始可以提建议,跟随作者一起互助进步了。 否则心血来潮,打一耙,作者忙活半天,结果发现拍脑门的想法又改回去。辛苦不说,结果实际你用两下,感觉的确不好,也不说了悄悄的就此匿了....没啥意思。我不是反对提建议,而是反对拍脑门有枣没枣打一竿子再说。

https://www.cnblogs.com/stronghorse/p/14572080.html https://www.cnblogs.com/stronghorse/p/15789961.html https://www.cnblogs.com/stronghorse/p/16545775.html 马先生这个思路才是釜底抽薪的终极办法,用正则直接处理pdf内部数据流。 `用正则表达式对PDF文件内容进行替换 喜欢这个功能的人喜欢到骨子里,甚至有人相信这个功能无所不能;讨厌这个功能的人也能讨厌到骨子里,甚至认为这个功能根本就是个坑。而我自己为了使用这个功能,《PDF Reference》也不知道翻了多少遍。 当年和国外某PDF软件开发者讨论这个功能的时候,他直接说我开发这个功能就是在打开潘多拉的盒子,所以我相信无论是过去、现在还是将来,都不会有哪家严肃的软件公司会开发出竞品。` 他们经常用这样的正则表达式去水印,异常简单: `/Xi\d+? Do ` 页面流P (为空)

这个建议好! 建议大佬@hiroi-sora: 加一个自动切换选项:(自定义一个行数阀值)比如5行,如果识别出来结果是5行内,自动切换为上下栏布局。

> 垂直间距很大 垂直间距很大--如果截图高度很高,就判为是这种情况。 ✅手动 ✅自动判断自动切换,可以勾选。并根据自定义阀值判断:如截图高度在400像素以内(解决你提到的垂直间距大问题) & 行数小于5行,自动切换为上下排;其他情况自动按默认。