XU comments

Results 7 comments of

XU

斗鱼改版无法录制

我也出现了问题，问题根源确实是shell里没有这个命令 getconf not found 可以在这个jsengine库下，修改一行代码解决 Lib\site-packages\jsengine\external.py ``` if os.name == 'posix': # Used in Unix is ARG_MAX in conf ARG_MAX = int(os.popen('getconf ARG_MAX').read()) ``` 调用 getconf 命令直接改成 ARG_MAX = 32...

中文OCR准确率很低

https://sspai.com/prime/story/rewind-diy 这个哥们也在复现rewind，用的ocr技术是 > 识别文字和压缩截图尺寸：使用 OCRmyPDF 少数派过去曾有一篇文章[介绍](https://sspai.com/prime/story/44045)如何通过 OCRmyPDF 在扫描版 PDF 中检索文字。本文沿用那篇文章所介绍的用法，唯一多用到的选项是 --optimize 3；根据[文档](https://sspai.com/link?target=https%3A%2F%2Focrmypdf.readthedocs.io%2Fen%2Flatest%2Fcookbook.html%23pdf-optimization)，这是指对图片进行比较激进的有损压缩，特别适合截图留档这种「能看清就行」的场景。

中文OCR准确率很低

我改本地代码调用了chineseOCRlite，删除数据库全部ocr，效果好了很多！字小的，模糊的可以考虑这个。用chineseOCRlite的时候，在crnn.py的25行加入，可以避免输出大量onnx的警告： ` rt.set_default_logger_severity(3)`

中文OCR准确率很低

https://cnocr.readthedocs.io/zh/latest/models/ cnocr 我看了一下，很灵活，cpu、gpu、模型都可以配置，效果很好。但是配环境很麻烦。最好还是能暴露接口

相同的程序，但是有LLM，尽快接入LLM api?

> wow感谢分享! ！这个项目看上去很棒！功能介绍上感觉它满足了我最开始的许多愿景、和接下来准备补齐的一些功能（比如先截图后归档压制视频、图像与文本向量化搜索、记录OCR的位置与前台进程信息等。而且正儿八经技术力比我强多了哈哈，很多想做的需求因为太菜只能慢慢研究，这个项目感觉有许多可以参考的实现！），使用上与 rewind 类似的时间轴回溯的也很好使（windrecorder还是太正儿八经归档一堆东西来搜索了）。 > > 看上去它的 LLM 对话完成度很高，做了许多类 agent 处理和分支的工程实现，真的很酷。目前这个 windrecorder 问题在于基建还不够完善，能提供给 LLM 使用的数据还不足，还得等未来一段时间慢慢补齐……（[https://github.com/yuka-friends/Windrecorder/issues/111）LLM](https://github.com/yuka-friends/Windrecorder/issues/111%EF%BC%89LLM) 目前也有许多体验的问题（工程上的、技术本身的）都还需要解决，是个虽然性感但现阶段还不着急可以观望的方向！（愿景上肯定也值得做 > > （要是增加了对 Windows 的良好支援感觉我就可以弃坑这个项目转投了x 感觉之后也许可以和这个项目作者沟通合作下！）我感觉你这边的项目更好，完成度更高，这边的开发者也更有热情。加入LLM很简单，也不用着急，后续有时间我也会加入共同合作，实在是太忙了

印章检测模型方便开源吗

您好 @Gmgge，非常感谢您和团队在印章检测项目上的努力和分享。我在学习和研究印章检测方面有很大的兴趣，希望获得您的检测模型文件，谢谢！

语音合成不了

同样的问题，希望可以接入自定义的通用语音接口，例如百度、阿里的