ignore1999
ignore1999
- 【FastDeploy版本】: 最新版镜像 - 【系统平台】: Linux x64(Ubuntu 18.04) - 【硬件】: Nvidia GPU 3080TI, CUDA 11.2 CUDNN 8.3 ``` payload = { "inputs" : [ { "name" : "INPUT", "shape" :...
#### 问题描述 / Problem Description 飞桨官网的通用OCR体验(https://aistudio.baidu.com/community/app/91660/webUI),识别效果比本地运行python3 tools/infer/predict_det.py 推理的效果好很多。 据悉官网版本用的模型并不特殊,能否提供官网体验版本服务化部署的代码和前后处理和http请求的图片编解码方式相关代码,以定位问题原因? #### 运行环境 / Runtime Environment - OS: Docker - Paddle: 2.3.2 - PaddleOCR: 2.6 #### 复现代码 / Reproduction Code python3 tools/infer/predict_det.py
### Discussed in https://github.com/opendatalab/MinerU/discussions/1108 Originally posted by **ignore1999** November 27, 2024 请问11月22日更新的“混合OCR文本提取能力”具体是指什么,是如何实现的? ``` 2024/11/22 0.10.0发布,通过引入混合OCR文本提取能力, 在公式密集、span区域不规范、部分文本使用图像表现等复杂文本分布场景下获得解析效果的显著提升 同时具备文本模式内容提取准确、速度更快与OCR模式span/line区域识别更准的双重优势 ```
是否有阿里云(registry.cn-hangzhou.aliyuncs.com)等平台的docker镜像供中国大陆内方便拉取?区别于dockerhub上的qwenllm/qwenvl:2.5-cu121