johnny20240812 comments

Results 8 comments of


                                            johnny20240812

paddleocr-vl 进行ocr识别的时候，很多图片都没有识别，而是只把图片提取出来？

第二张图是原图，第一张图，是从原图中分离出来的子图。有没有什么配置项，是可以识别出印章图片以外的所有图片文字

paddleocr-vl 进行ocr识别的时候，很多图片都没有识别，而是只把图片提取出来？

最小复现------------------------------------------------------------------------------------------------ 客户端代码： ocr_model = PaddleOCRVL( paddlex_config="PaddleOCR-VL.yaml" ) output = ocr_model.predict(task_all_data[0],use_queues=False) for res in output: res.save_to_markdown(save_path=output_dir) ----------------------------------------------------------------------------------------------------- 输出的结果：xxx.md格式。内容如下： ----------------------------------------------------------------------------------------------------- 从结果上看，似乎只是找到了有几张图，没有对图片内容进行识别和转换？但是，很多其他的ocr都识别了 ----------------------------------------------------------------------------------------------------- 我的PaddleOCR-VL.yaml配置如下： pipeline_name: PaddleOCR-VL batch_size: 64 use_queues: True use_doc_preprocessor: False use_layout_detection:...

paddleocr-vl 进行ocr识别的时候，很多图片都没有识别，而是只把图片提取出来？

paddlex_genai_server --model_name PaddleOCR-VL-0.9B --backend vllm --port 8118 --backend_config 'vllm_config.json' 我是使用这种方式，启动的vllm服务

paddleocr-vl 进行ocr识别的时候，很多图片都没有识别，而是只把图片提取出来？

我的天，我仔细的看了官方的文档，我启动vllm服务的时候，用的是paddlex_genai_server --model_name PaddleOCR-VL-0.9B --backend vllm --port 8118 --backend_config 'vllm_config.json' 。但是，官方的代码是： paddleocr genai_server --model_name PaddleOCR-VL-0.9B --backend vllm --backend_config vllm_config.yaml 难道是这个错误，导致的，只识别结构，而不识别内容？

paddleocr-vl 进行ocr识别的时候，很多图片都没有识别，而是只把图片提取出来？

我换了--model_name PaddleOCR-VL-0.9B --backend vllm --port 8118 --backend_config 'vllm_config.json' 。这个命令。得到的效果是一样的。

paddleocr-vl 进行ocr识别的时候，很多图片都没有识别，而是只把图片提取出来？

我通过程序解决了，先把这个给关闭把，官方的api应该也是通过代码判断实现的。感谢

Paddle-VL 初始化加载后，python 内核直接崩溃重启了。

I1029 08:45:03.915448 15400 pir_interpreter.cc:1524] New Executor is Running ... WARNING: Logging before InitGoogleLogging() is written to STDERR W1029 08:45:03.915448 15400 gpu_resources.cc:114] Please NOTE: device: 0, GPU Compute Capability: 8.9, Driver...

Paddle-VL 初始化加载后，python 内核直接崩溃重启了。

没事，我这个是windows 11操作系统可能是这个原因，所以不能用。我现在用tls来操作吧，就是麻烦点。感谢