Stefan3Zz comments

Results 20 comments of


                                            Stefan3Zz

Frequently Asked Questions on Inference and Deployment of PaddleOCR-VL PaddleOCR-VL 推理部署相关高频问题回复

docker run \ -it \ --rm \ --gpus "'device=0,1'" \ --network host \ -v /mnt/nvme2n1/lingshu:/data \ ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddlex-genai-vllm-server \ paddlex_genai_server --model_name PaddleOCR-VL-0.9B --host 0.0.0.0 --port 13515 --backend vllm --model_dir /data/PaddlePaddle/PaddleOCR-VL/PaddleOCR-VL-0.9B 请问我希望多卡部署，但是我run的时候指定了两个0，1两张卡，但是实际使用运行的时候，我发现只有0这张卡被用到了，是还缺少哪些参数吗

Frequently Asked Questions on Inference and Deployment of PaddleOCR-VL PaddleOCR-VL 推理部署相关高频问题回复

> > docker run -it --rm --gpus "'device=0,1'" --network host -v /mnt/nvme2n1/lingshu:/data ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddlex-genai-vllm-server paddlex_genai_server --model_name PaddleOCR-VL-0.9B --host 0.0.0.0 --port 13515 --backend vllm --model_dir /data/PaddlePaddle/PaddleOCR-VL/PaddleOCR-VL-0.9B > > 请问我希望多卡部署，但是我run的时候指定了两个0，1两张卡，但是实际使用运行的时候，我发现只有0这张卡被用到了，是还缺少哪些参数吗 > > 默认配置是在单张GPU上运行的，如果需要多卡执行的话，可以使用vllm的tp并行或dp并行功能，在启动服务的时候通过`--backend_config`选项设置相应的参数。详情可参考vllm官方文档。...

Frequently Asked Questions on Inference and Deployment of PaddleOCR-VL PaddleOCR-VL 推理部署相关高频问题回复

> 可能是因为本地显卡的显存比较小给KV cache预留的显存也得少一些我一张卡是40g诶，所以默认的0.5会导致不够是吗

Frequently Asked Questions on Inference and Deployment of PaddleOCR-VL PaddleOCR-VL 推理部署相关高频问题回复

> 可能是因为本地显卡的显存比较小给KV cache预留的显存也得少一些我还想知道一个问题，如果我这个参数给到0.8让他占用显存高一点，会对解析速度有帮助吗

Frequently Asked Questions on Inference and Deployment of PaddleOCR-VL PaddleOCR-VL 推理部署相关高频问题回复

请问一下，我现在使用docker run \ -it \ -d \ --rm \ --gpus '"device=1,2"' \ --network host \ -v /mnt/nvme2n1/lingshu:/data \ ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddlex-genai-vllm-server \ paddlex_genai_server --model_name PaddleOCR-VL-0.9B --host 0.0.0.0 --port 13515 --backend vllm --model_dir...

请问我指定使用vl模型服务，但是还要给我下载PP-DocLayoutV2

我的理解这个模型不是一次性搞定的吗不应该走pipeline了吧

请问我指定使用vl模型服务，但是还要给我下载PP-DocLayoutV2

> 您好，PP-DocLayutV2是PaddleOCR-VL中负责文档的版面的检测和阅读顺序的部分，如果只是单纯的文字识别，可以直接用其中的VLM部分PaddleOCR-VL-0.9B模型，但是可能有更多的人做文档解析，所以增加了PP-DocLayutV2。另外，PP-DocLayoutV2的参数量很少，所以不会占用很多空间。但是我PP-DocLayutV2 也下载下来了，但是我想问下，可以把PP-DocLayutV2 和PaddleOCR-VL-0.9B 包装成一个服务吗就像mineru2.5，我可以直接通过接口调用就能拿到所有版面信息以及内容信息比如我通过docker run \ -it \ --rm \ --gpus all \ --network host \ ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddlex-genai-vllm-server \ paddlex_genai_server --model_name PaddleOCR-VL-0.9B --host 0.0.0.0 --port 8118 --backend vllm...

使用paddlex3.0.0.b2的时候，在cuda版本为12.2的版本中遇到了问题

> 哪个模型呢，是特定的样本才会报错吗？这个问题可以稳定复现么。是paddlex默认下载的模型，是稳定复现的，不是特定样本

使用paddlex3.0.0.b2的时候，在cuda版本为12.2的版本中遇到了问题

> > > 哪个模型呢，是特定的样本才会报错吗？这个问题可以稳定复现么。 > > > > > > 是paddlex默认下载的模型，是稳定复现的，不是特定样本 > > 请问你的执行命令是？Paddle的安装命令是？是通过python代码执行的 ![image](https://github.com/user-attachments/assets/22a121e8-3e73-4902-b641-729ce8942da6) ![image](https://github.com/user-attachments/assets/8f73190a-0f88-4e94-aebf-d8639a77782d)

使用paddlex3.0.0.b2的时候，在cuda版本为12.2的版本中遇到了问题

![image](https://github.com/user-attachments/assets/b0e54209-19b6-408d-9107-ba545ccb27dc) 请问有对应的12.2的版本吗