hellofinch
hellofinch
https://github.com/Byaidu/PDFMathTranslate/issues/19 OCR WIP
看上去是行内公式没没放在句子中去翻译,估计是解析的时候加的判断给跳过去了。
试试别的PDF阅读器和系统看看,可能是显示的问题
> 同时连简单的上一页末句和下一页首句的连句/断句翻译都没能翻好 因为翻译是按PDF的段来进行的,目前并没有区分上下文的功能。 重影的问题请先确认需要翻译的PDF不是扫描件,扫描件的话2.0才有处理。 PDF中的图片上的内容是不处理的,所以图片没有翻译是正常的。
根据问题描述来看,./config.json第一次没有读入。 我需要测试一下尝试复习问题,如有进展会在这个issue中更新。
提供一下可复现的pdf吧,谢谢。
 pip和docker安装的版本,使用图中的方式设置。 : )
那是最新的代码里有,PR过程中会更新Readme。不然等到版本发布的时候,应该不知道中间添加过什么了。
@Byaidu 请求关闭issue。
其实应该是可以弄的,现在的模型可以提取出不同类型文本的位置,然后ocr也是可以复用这个框的。 我之前没搞定的地方在于怎么生成一个新的pdf页。