Andy AO comments

Results 63 comments of


                                            Andy AO

[建议]在合并翻译行数不一致时提供行号

我们可以做一个假设，通常来说译文和原文的字数不会相差太大，如果原文是100字符，译文大概率不是10个字符。那么还建议检查行是否一致，没有办法准确检查，但可以提示**疑似高度不一致**的结果，然后进行标注，这样发现和纠正问题将更快。

> 行号是可行的。 > > > 我们可以做一个假设，通常来说译文和原文的字数不会相差太大，如果原文是100字符，译文大概率不是10个字符。那么还建议检查行是否一致，没有办法准确检查，但可以提示**疑似高度不一致**的结果，然后进行标注，这样发现和纠正问题将更快。 > > 但是，没太理解这个描述。目前只要行数不一致就会标记成黄色，还需要**疑似高度不一致**这个条件吗？。 > > 另外，除了 ChatGPT 这种可能丢失行，Google 翻译之类的有时也会出现错误，比如翻译多行时只返回一行。行数不一致的话，我们只知道整体有问题，因此在条目列表的UI上标注为黄色，这个是已经实现的功能。如果查看文本的UI上有了行号的话，那么我们也想知道具体是从哪一行开始有了问题，这就需要依据假设进行猜测，这个假设可以是字符数明显不同。猜测出来之后在对应的行上也进行标注，比如高亮或者波浪线，这样可以便于排错。

[建议]在合并翻译行数不一致时提供行号

> 了解了。不过根据字符数标记问题位置感觉不太可靠，因为没有判断不同语言之间原文的译文长度比例的依据。另外，这种标记要在识别十分精准的情况下才可行，否则可能会让人疑惑。这是一个能够极大方便排错的功能，根据我的经验，出现这种情况意味着在该位置的前方不远处，问题已经出现。我理解你的担心，正如你所说，它会带来一些问题，不过我认为这些问题可以有解决方案，这里分享一下我的思考。 1. 有的人可能无法理解，这只是个高度疑似的提醒，我认为这可以通过不默认开启该功能来解决，这样如果有人需要的话，那么他会手动开启该功能，开启的时候就会看到该功能的名称，从而理解是什么意思 2. 译文和原文的比值也可以自定义，默认可以是0.1，也就是1:10，如果需要可以增大或减小。

处理分辨率较高，但是仍然模糊的情况

发现有参数可以更改，改完之后似乎可以了，正在跑 ```bat @echo off if "%~x1"==".pdf" ( java -jar "%~dp0PDFtool.jar" -e "%~1" --max-wh=2147483647 --min-wh=100 "%~dp0realesrgan-ncnn-vulkan.exe" -i "%~1_img" ) else ( "%~dp0realesrgan-ncnn-vulkan.exe" -i "%~1" ) pause ```

处理分辨率较高，但是仍然模糊的情况

![图片](https://github.com/tumuyan/SourceBook-Dataset/assets/38101170/6c9dc3f9-e23d-434d-bfb5-6a43f1e1d538) 处理结果出来了，感觉有点小失望，似乎效果不是太好。只是处理一页，看看对OCR有没有帮助吧。

处理分辨率较高，但是仍然模糊的情况

OCR之后对比发现，超分辨率后反而劣化了。不管是从肉眼上看，还是从OCR结果上看，至少对于那本PDF来说该程序没有任何的帮助。

处理分辨率较高，但是仍然模糊的情况

原因是什么呢？有点好奇

处理分辨率较高，但是仍然模糊的情况

@tumuyan 发现该程序的PDF导出图片的机制不行。如果让程序自动处理PDF，那么最后做出来的结果就是劣化的，如上图所示。可是如果使用别的软件，比如PDF-XChange Editor导出为tif文件，超分辨率结果就很好 ![图片](https://github.com/tumuyan/SourceBook-Dataset/assets/38101170/76aa9ada-0ed3-4bb1-a3ff-7a25150c5d93) [程序自动处理pdf会导致结果劣化.zip](https://github.com/tumuyan/SourceBook-Dataset/files/12450618/pdf.zip)

处理分辨率较高，但是仍然模糊的情况

另外发现如果提升gamma，那么效果会更好 ![图片](https://github.com/tumuyan/SourceBook-Dataset/assets/38101170/6be890fa-64d5-4a75-bfb9-6a61b2306856)

处理分辨率较高，但是仍然模糊的情况

自己先导出，然后调整gamma，最后再用这个AI超分辨率，效果相当好。 ![图片](https://github.com/tumuyan/SourceBook-Dataset/assets/38101170/7e0ed901-68e0-4f36-b360-b9b64d984bc7) **如果能将前面两个步骤自动化就更好了**