hellofinch

Results 176 comments of hellofinch

https://github.com/Byaidu/PDFMathTranslate/issues/19 OCR WIP

看上去是行内公式没没放在句子中去翻译,估计是解析的时候加的判断给跳过去了。

试试别的PDF阅读器和系统看看,可能是显示的问题

> 同时连简单的上一页末句和下一页首句的连句/断句翻译都没能翻好 因为翻译是按PDF的段来进行的,目前并没有区分上下文的功能。 重影的问题请先确认需要翻译的PDF不是扫描件,扫描件的话2.0才有处理。 PDF中的图片上的内容是不处理的,所以图片没有翻译是正常的。

根据问题描述来看,./config.json第一次没有读入。 我需要测试一下尝试复习问题,如有进展会在这个issue中更新。

提供一下可复现的pdf吧,谢谢。

![image](https://github.com/user-attachments/assets/515442d7-e4ae-4451-8e6e-070f2173d964) pip和docker安装的版本,使用图中的方式设置。 : )

那是最新的代码里有,PR过程中会更新Readme。不然等到版本发布的时候,应该不知道中间添加过什么了。

@Byaidu 请求关闭issue。

其实应该是可以弄的,现在的模型可以提取出不同类型文本的位置,然后ocr也是可以复用这个框的。 我之前没搞定的地方在于怎么生成一个新的pdf页。