hellofinch comments

Results 176 comments of


                                            hellofinch

https://github.com/Byaidu/PDFMathTranslate/issues/19 OCR WIP

看上去是行内公式没没放在句子中去翻译，估计是解析的时候加的判断给跳过去了。

试试别的PDF阅读器和系统看看，可能是显示的问题

> 同时连简单的上一页末句和下一页首句的连句/断句翻译都没能翻好因为翻译是按PDF的段来进行的，目前并没有区分上下文的功能。重影的问题请先确认需要翻译的PDF不是扫描件，扫描件的话2.0才有处理。 PDF中的图片上的内容是不处理的，所以图片没有翻译是正常的。

根据问题描述来看，./config.json第一次没有读入。我需要测试一下尝试复习问题，如有进展会在这个issue中更新。

提供一下可复现的pdf吧，谢谢。

![image](https://github.com/user-attachments/assets/515442d7-e4ae-4451-8e6e-070f2173d964) pip和docker安装的版本，使用图中的方式设置。 : )

那是最新的代码里有，PR过程中会更新Readme。不然等到版本发布的时候，应该不知道中间添加过什么了。

@Byaidu 请求关闭issue。

其实应该是可以弄的，现在的模型可以提取出不同类型文本的位置，然后ocr也是可以复用这个框的。我之前没搞定的地方在于怎么生成一个新的pdf页。