XU

Results 7 comments of XU

我也出现了问题,问题根源确实是shell里没有这个命令 getconf not found 可以在这个jsengine库下,修改一行代码解决 Lib\site-packages\jsengine\external.py ``` if os.name == 'posix': # Used in Unix is ARG_MAX in conf ARG_MAX = int(os.popen('getconf ARG_MAX').read()) ``` 调用 getconf 命令直接改成 ARG_MAX = 32...

https://sspai.com/prime/story/rewind-diy 这个哥们也在复现rewind,用的ocr技术是 > 识别文字和压缩截图尺寸:使用 OCRmyPDF 少数派过去曾有一篇文章[介绍](https://sspai.com/prime/story/44045)如何通过 OCRmyPDF 在扫描版 PDF 中检索文字。本文沿用那篇文章所介绍的用法,唯一多用到的选项是 --optimize 3;根据[文档](https://sspai.com/link?target=https%3A%2F%2Focrmypdf.readthedocs.io%2Fen%2Flatest%2Fcookbook.html%23pdf-optimization),这是指对图片进行比较激进的有损压缩,特别适合截图留档这种「能看清就行」的场景。

我改本地代码调用了chineseOCRlite,删除数据库全部ocr,效果好了很多! 字小的,模糊的可以考虑这个。 用chineseOCRlite的时候,在crnn.py的25行加入,可以避免输出大量onnx的警告: ` rt.set_default_logger_severity(3)`

https://cnocr.readthedocs.io/zh/latest/models/ cnocr 我看了一下,很灵活,cpu、gpu、模型都可以配置,效果很好。但是配环境很麻烦。 最好还是能暴露接口

> wow感谢分享! !这个项目看上去很棒!功能介绍上感觉它满足了我最开始的许多愿景、和接下来准备补齐的一些功能(比如先截图后归档压制视频、图像与文本向量化搜索、记录OCR的位置与前台进程信息等。而且正儿八经技术力比我强多了哈哈,很多想做的需求因为太菜只能慢慢研究,这个项目感觉有许多可以参考的实现!),使用上与 rewind 类似的时间轴回溯的也很好使(windrecorder还是太正儿八经归档一堆东西来搜索了)。 > > 看上去它的 LLM 对话完成度很高,做了许多类 agent 处理和分支的工程实现,真的很酷。目前这个 windrecorder 问题在于基建还不够完善,能提供给 LLM 使用的数据还不足,还得等未来一段时间慢慢补齐……([https://github.com/yuka-friends/Windrecorder/issues/111)LLM](https://github.com/yuka-friends/Windrecorder/issues/111%EF%BC%89LLM) 目前也有许多体验的问题(工程上的、技术本身的)都还需要解决,是个虽然性感但现阶段还不着急可以观望的方向!(愿景上肯定也值得做 > > (要是增加了对 Windows 的良好支援感觉我就可以弃坑这个项目转投了x 感觉之后也许可以和这个项目作者沟通合作下!) 我感觉你这边的项目更好,完成度更高,这边的开发者也更有热情。加入LLM很简单,也不用着急,后续有时间我也会加入共同合作,实在是太忙了

您好 @Gmgge, 非常感谢您和团队在印章检测项目上的努力和分享。我在学习和研究印章检测方面有很大的兴趣,希望获得您的检测模型文件,谢谢!

同样的问题,希望可以接入自定义的通用语音接口,例如百度、阿里的