johnny20240812

Results 8 comments of johnny20240812

第二张图是原图,第一张图,是从原图中分离出来的子图。有没有什么配置项,是可以识别出印章图片以外的所有图片文字

最小复现------------------------------------------------------------------------------------------------ 客户端代码: ocr_model = PaddleOCRVL( paddlex_config="PaddleOCR-VL.yaml" ) output = ocr_model.predict(task_all_data[0],use_queues=False) for res in output: res.save_to_markdown(save_path=output_dir) ----------------------------------------------------------------------------------------------------- 输出的结果:xxx.md格式。内容如下: ----------------------------------------------------------------------------------------------------- 从结果上看,似乎只是找到了有几张图,没有对图片内容进行识别和转换?但是,很多其他的ocr都识别了 ----------------------------------------------------------------------------------------------------- 我的PaddleOCR-VL.yaml配置如下: pipeline_name: PaddleOCR-VL batch_size: 64 use_queues: True use_doc_preprocessor: False use_layout_detection:...

paddlex_genai_server --model_name PaddleOCR-VL-0.9B --backend vllm --port 8118 --backend_config 'vllm_config.json' 我是使用这种方式,启动的vllm服务

我的天,我仔细的看了官方的文档,我启动vllm服务的时候,用的是paddlex_genai_server --model_name PaddleOCR-VL-0.9B --backend vllm --port 8118 --backend_config 'vllm_config.json' 。 但是,官方的代码是: paddleocr genai_server --model_name PaddleOCR-VL-0.9B --backend vllm --backend_config vllm_config.yaml 难道是这个错误,导致的,只识别结构,而不识别内容?

我换了--model_name PaddleOCR-VL-0.9B --backend vllm --port 8118 --backend_config 'vllm_config.json' 。这个命令。得到的效果是一样的。

我通过程序解决了,先把这个给关闭把,官方的api应该也是通过代码判断实现的。感谢

I1029 08:45:03.915448 15400 pir_interpreter.cc:1524] New Executor is Running ... WARNING: Logging before InitGoogleLogging() is written to STDERR W1029 08:45:03.915448 15400 gpu_resources.cc:114] Please NOTE: device: 0, GPU Compute Capability: 8.9, Driver...

没事,我这个是windows 11操作系统可能是这个原因,所以不能用。我现在用tls来操作吧,就是麻烦点。感谢