PaddleX icon indicating copy to clipboard operation
PaddleX copied to clipboard

PaddlePaddle End-to-End Development Toolkit(『飞桨』深度学习全流程开发工具)

Results 466 PaddleX issues
Sort by recently updated
recently updated
newest added
trafficstars

## Checklist: - [x] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [x] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [x] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [x] 确认bug是否在新版本里还未修复 ## 描述问题 以serve形式启动涉及版面识别的piepline,layout_threshold不支持以字典形式给不同目标类型不同的阈值 ## 复现 启动服务 paddlex --serve --pipeline seal_recognition 调用服务 ret = requests.post(url=PADDLE_SEAL_URL, json={'file':...

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 确认bug是否在新版本里还未修复 ## 描述问题 ## 复现 1. 高性能推理 * 您是否完全按照[高性能推理文档教程](https://paddlepaddle.github.io/PaddleX/main/pipeline_deploy/high_performance_inference.html)跑通了流程? 2. 服务化部署 *...

本PR主要为PaddleX增加一个实验性质的并行加速功能,旨在优化代码库中广泛存在的类似:`[func(item) for item in data]`这样的[过易并行](https://zh.wikipedia.org/wiki/%E8%BF%87%E6%98%93%E5%B9%B6%E8%A1%8C)的逻辑。 ### PR内容 1. 新增基于[`joblib`](https://joblib.readthedocs.io/en/stable/)的并行加速功能。 - 新增`maybe_parallelize`函数,可用于标记代码库中的过易并行逻辑,并在配置满足要求时将其并行化。 - 支持设置一个全局执行器以复用线程池/进程池,提升效率;也支持通过`joblib.parallel_config`从库的外部定制PaddleX的默认并行计算行为。 - 通过环境变量控制该功能是否开启,默认关闭。 2. 基于新增的并行加速功能,优化了数据读取操作、大部分模块的前后处理操作以及部分产线的操作。目前的实现,在我的机器上,batch size为32时,启动并行计算功能后,默认配置可以将PP-DocLayout-L的端到端推理时间**缩短一半**,将PP-OCRv4_mobile_det的预处理时间**缩短为原本的1/10**。 3. 定位到目前OCR类产线推理的一大性能瓶颈在于`scipy.ndimage.rotate`的速度太慢了。使用OpenCV编写了替代的高效实现,初步测量对1024*2048的大图加速可以达到**近百倍**,但与原实现不是完全对齐(看起来可能主要是输出尺寸和align-corner方面有差别),需确认这个替代实现是否可接受。在我的机器上实验,使用新的实现,可以让OCR产线处理一个6页示例PDF的时间**从13s降低到6s**。 => 2025.3.26,替代实现的精度被相关同学评估为可以接受,为了让这个PR的内容更专一,这一点涉及的修改被移动到更相关的 #3714 。 ### 缺陷与待办 1. 新增的并行加速功能对OCR类产线的优化不明显,这主要是因为当前OCR类产线的许多模块接受的batch size都是1。 2....

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 确认bug是否在新版本里还未修复 ## 描述问题 腾讯云服务器上通过命令行方式运行通用OCR产线,识别速度慢,指定 --device gpu:0 平均需要6秒,指定--device cpu 平均需要12秒。 ## 复现 命令:...

请问,PP-ChatOCRv4 怎么调用本地部署的大模型,有没有demo或者说明文档? 现在的文档上只有 **「如果使用本地部署的大模型服务,可以参考[PaddleNLP大模型部署文档](https://github.com/PaddlePaddle/PaddleNLP/tree/develop/llm)进行大模型部署对话接口部署和向量化接口部署,并填写对应的 base_url 和 api_key 即可」** 这句话,我看了下,没太明白怎么调用。

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 确认bug是否在新版本里还未修复 ## 描述问题 ## 复现 1. 您是否已经正常运行我们提供的[教程](https://paddlepaddle.github.io/PaddleX/main/index.html)? 2. 您是否在教程的基础上修改代码内容?还请您提供运行的代码 3. 您使用的数据集是? 4....

我使用官方ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-npu:cann800-ubuntu20-npu-910b-base-aarch64-gcc84 docker环境,paddlex 3.0-RC1, python -c "import paddle; print(paddle.__version__)" 测试没有问题。通过查找发现调用模型SLANet-plus出现此问题。 root@ubuntu:/work# paddlex --pipeline layout_parsing \ > --input 0011.jpeg \ > --use_doc_orientation_classify False \ > --use_doc_unwarping False \ > --use_textline_orientation False \...

使用PP-YOLOE_plus_SOD-L,运行到验证集评估的阶段就开始报错 ``` [05/21 14:21:36] ppdet.engine.callbacks INFO: Epoch: [0] [380/396] learning_rate: 0.000025 loss: 0.864219 loss_cls: 0.473560 loss_iou: 0.049636 loss_dfl: 0.528526 loss_l1: 0.049658 eta: 0:32:15 batch_cost: 0.2519 data_cost: 0.0014 ips: 7.9396 images/s,...

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 如果是数据校验问题,请确保在开源PaddleX中可以通过数据校验 ## 描述问题 2025-05-09 10:10:14,834 - pp-pipeline-exec - INFO - u-15431615-pp-p-9f232fa769b6-tt-9f2331e23c0b 2025-05-09...

使用官方提供的模型进行推理,怎么修改输入输出序列的长度,yaml中的文件只能是输入96,输出96,修改就会报错,