Andy AO
Andy AO
> 现阶段只能暂时记下这个问题,后面再慢慢研究下。 最近在添加 pdf 翻译的支持。 我现在要处理PDF,是先用word转换成html,转化效果通常相当好。如果是图片版的话,我会用 ABBYY 输出 html,效果也相当好,虽然目前效果不错,但是整个流程还是麻烦些,如果直接在浏览器中可以看PDF那么要好的多。 我知道本扩展是自带类似的功能的,但是那个效果实在一般,因为它没有很好地保留换行和分段的信息。导致结果可读性很差。
> > > 现阶段只能暂时记下这个问题,后面再慢慢研究下。 最近在添加 pdf 翻译的支持。 > > > > > > 我现在要处理PDF,是先用word转换成html,转化效果通常相当好。如果是图片版的话,我会用 ABBYY 输出 html,效果也相当好,虽然目前效果不错,但是整个流程还是麻烦些,如果直接在浏览器中可以看PDF那么要好的多。 > > 我知道本扩展是自带类似的功能的,但是那个效果实在一般,因为它没有很好地保留换行和分段的信息。导致结果可读性很差。 > > 对的,pdf现在难点就是分段。 目前市面上的pdf转化 html工具都是把每一个元素用绝对定位的方式呈现,这导致完全丢失了分段的信息。 所以我目前的思路是,分析每一行直接的绝对定位之间的距离,根据距离来决定上下两行是否是同一段落。 > > 目前在基于这个工具的转化来做: https://github.com/mozilla/pdf.js...
> > > 是不是复杂的网页就是出现 loading 动画不转圈? 我是觉得不转圈可能就是浏览器本身处理变化的时候处理不过来。 > > > > > > 复杂指的如果是内容多少的话,那么维基百科随便的简单的页面,没有任何卡顿都会出现动画停转的问题。但是有的网页内容非常多,动画好像仍然存在。所以说动画存在与否似乎和卡顿没有关系。 > > 下面这个网页内容是如此少,但动画仍然是不动的。 > > [Bug - Wikipedia --- 错误 - 维基百科](https://en.wikipedia.org/wiki/Bug) > > 有空试试最新版本,修复了一下loading ,试试看这个简单页面的loading...
关于loading的问题,可以忽略,因为对使用真的没影响。
示例传给你了, MS-Word 2 个,是文字版 PDF,ABBYY 1 个,图片版 PDF,这两个基本上没有排版错误。翻译用的不是这个插件,因为这个插件我主要用于翻译在线内容,这个不影响展示 pdf 转 html 的效果。 总是上传失败,原因不明,用度盘发了,很小,下载不费时间  链接: https://pan.baidu.com/s/1V8Uuc00YA_gFj35-Zng8nQ?pwd=1111 提取码: 1111 复制这段内容后打开百度网盘手机App,操作更方便哦
Loading动画卡死的问题已经解决了,不知道从什么时候开始突然就好了(我那时候没发现是不是忘了,reload,我真的记不清楚了,应该不会吧)。维基百科该卡还是卡,这进一步说明了loading动画的问题和卡顿的问题是两个问题。
> 我有一个优化的方向,就是目前扩展对dom结构标记了很多东西,但是这些标记可以转移到 js 的 element 对象里, 我估计这个优化应该可以解决一些问题。 哦,原来是这样,那说不定可以提高性能啊。 据说操作这个dom会导致性能不太好,所以有的会用虚拟dom缓存请求,能不改就不改,能一起改就一起改。我不太懂前端啊,但是我大概了解了一下有这种想法。
> 最新版已优化我上面说的这个。试试看有没有好转.. 没有好转 还有就是,下载了个软件,能客观地检测是否影响「系统响应性」,的确发现响应性被影响,关闭之后影响结束,这个和感受一致。虽然软件自动调低了进程的优先级,问题仍然没有得到太大改善,还是影响系统。 
> 好吧.. 那我暂时没想到有什么可以明显优化的点了.. > > 要不试试Firefox?不知道会不会好点... 从性能的图上来看,就是一个核直接被接近占满了,但别的核还好好的。然后内存非常充足。应该资源很够啊,不知道为什么系统会卡,这个不了解,对windows不了解,由于卡顿不局限于浏览器,而是整个系统,所以怀疑是windows的问题,可能这个软件在windows上优化有问题,不过还需要在别的windows电脑上复现才可以。  我这儿就试试firefox,看看这个和chromium有没有关系
> 这是一个很好的思路,谢谢,我完了研究一下看看好不好做到。 > > 相当于,我们默认把双栏自适应为单栏是吧? 这样建议是基于这样的观察,将双栏变成单栏的 ABBYY 在转换中给出了几乎完美的排版,Word 应对这种情况时倾向于继续双栏,做出来的效果很差。 如果有需要的话可以提供文件供参考。