WeKnora icon indicating copy to clipboard operation
WeKnora copied to clipboard

[Question]: process_chunks_images函数中信号量固定为1的原因?

Open lovepeace-max opened this issue 3 months ago • 1 comments

问题类别

其他

问题描述

您好, 我在看docreader的代码的时候,看到对于切分后的chunks,如果要对每一个chunk做图片的ocr识别,是通过process_chunks_images函数来执行的,但是函数中代码将并发量限制为1了,这么固定的原因是?如果机器配置比较好,这里是不是可以设置为更大的数?

 async def process_all_chunks():
            # Set max concurrency, reduce concurrency to avoid resource contention
            max_concurrency = min(self.max_concurrent_tasks, 1)  # Reduce concurrency
            # Use semaphore to limit concurrency
            semaphore = asyncio.Semaphore(max_concurrency)

背景信息

No response

操作系统

macOS

其他环境信息

No response

相关日志


已查找的资源

No response

确认事项

  • [x] 我已经搜索了现有的 issues 和文档
  • [x] 我已经提供了足够的信息来帮助理解问题

lovepeace-max avatar Sep 25 '25 07:09 lovepeace-max

当前的ocr实现在并发场景存在问题,如果有优化方案也欢迎提pr

begoniezhao avatar Oct 21 '25 12:10 begoniezhao