PaddleX issues

版面区域检测模块以API启动时layout_threshold不支持以字典形式给不同目标类型不同的阈值

1

## Checklist: - [x] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [x] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [x] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [x] 确认bug是否在新版本里还未修复 ## 描述问题以serve形式启动涉及版面识别的piepline，layout_threshold不支持以字典形式给不同目标类型不同的阈值 ## 复现启动服务 paddlex --serve --pipeline seal_recognition 调用服务 ret = requests.post(url=PADDLE_SEAL_URL, json={'file':...

harryzwh

aarch64 cpu未支持onnxruntime

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 确认bug是否在新版本里还未修复 ## 描述问题 ## 复现 1. 高性能推理 * 您是否完全按照[高性能推理文档教程](https://paddlepaddle.github.io/PaddleX/main/pipeline_deploy/high_performance_inference.html)跑通了流程？ 2. 服务化部署 *...

tomjimi2019

[Feat][Experimental] Support parallel computing (embarassingly parallel)

3

本PR主要为PaddleX增加一个实验性质的并行加速功能，旨在优化代码库中广泛存在的类似：`[func(item) for item in data]`这样的[过易并行](https://zh.wikipedia.org/wiki/%E8%BF%87%E6%98%93%E5%B9%B6%E8%A1%8C)的逻辑。 ### PR内容 1. 新增基于[`joblib`](https://joblib.readthedocs.io/en/stable/)的并行加速功能。 - 新增`maybe_parallelize`函数，可用于标记代码库中的过易并行逻辑，并在配置满足要求时将其并行化。 - 支持设置一个全局执行器以复用线程池/进程池，提升效率；也支持通过`joblib.parallel_config`从库的外部定制PaddleX的默认并行计算行为。 - 通过环境变量控制该功能是否开启，默认关闭。 2. 基于新增的并行加速功能，优化了数据读取操作、大部分模块的前后处理操作以及部分产线的操作。目前的实现，在我的机器上，batch size为32时，启动并行计算功能后，默认配置可以将PP-DocLayout-L的端到端推理时间**缩短一半**，将PP-OCRv4_mobile_det的预处理时间**缩短为原本的1/10**。 3. 定位到目前OCR类产线推理的一大性能瓶颈在于`scipy.ndimage.rotate`的速度太慢了。使用OpenCV编写了替代的高效实现，初步测量对1024*2048的大图加速可以达到**近百倍**，但与原实现不是完全对齐（看起来可能主要是输出尺寸和align-corner方面有差别），需确认这个替代实现是否可接受。在我的机器上实验，使用新的实现，可以让OCR产线处理一个6页示例PDF的时间**从13s降低到6s**。 => 2025.3.26，替代实现的精度被相关同学评估为可以接受，为了让这个PR的内容更专一，这一点涉及的修改被移动到更相关的 #3714 。 ### 缺陷与待办 1. 新增的并行加速功能对OCR类产线的优化不明显，这主要是因为当前OCR类产线的许多模块接受的batch size都是1。 2....

Bobholamovic

通用OCR产线执行速度慢

9

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 确认bug是否在新版本里还未修复 ## 描述问题腾讯云服务器上通过命令行方式运行通用OCR产线，识别速度慢，指定 --device gpu:0 平均需要6秒，指定--device cpu 平均需要12秒。 ## 复现命令：...

LvZhenChang

PP-ChatOCRv4 怎么调用本地部署的大模型

1

请问，PP-ChatOCRv4 怎么调用本地部署的大模型，有没有demo或者说明文档？现在的文档上只有 **「如果使用本地部署的大模型服务，可以参考[PaddleNLP大模型部署文档](https://github.com/PaddlePaddle/PaddleNLP/tree/develop/llm)进行大模型部署对话接口部署和向量化接口部署，并填写对应的 base_url 和 api_key 即可」** 这句话，我看了下，没太明白怎么调用。

LvZhenChang

训练image_anomaly_detection时报错

2

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 确认bug是否在新版本里还未修复 ## 描述问题 ## 复现 1. 您是否已经正常运行我们提供的[教程](https://paddlepaddle.github.io/PaddleX/main/index.html)？ 2. 您是否在教程的基础上修改代码内容？还请您提供运行的代码 3. 您使用的数据集是？ 4....

xielongzhu

昇腾910使用table_recognition产线出现错误。

2

我使用官方ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-npu:cann800-ubuntu20-npu-910b-base-aarch64-gcc84 docker环境，paddlex 3.0-RC1, python -c "import paddle; print(paddle.__version__)" 测试没有问题。通过查找发现调用模型SLANet-plus出现此问题。 root@ubuntu:/work# paddlex --pipeline layout_parsing \ > --input 0011.jpeg \ > --use_doc_orientation_classify False \ > --use_doc_unwarping False \ > --use_textline_orientation False \...

zryf2000

小目标检测训练过程中报错

使用PP-YOLOE_plus_SOD-L，运行到验证集评估的阶段就开始报错 ``` [05/21 14:21:36] ppdet.engine.callbacks INFO: Epoch: [0] [380/396] learning_rate: 0.000025 loss: 0.864219 loss_cls: 0.473560 loss_iou: 0.049636 loss_dfl: 0.528526 loss_l1: 0.049658 eta: 0:32:15 batch_cost: 0.2519 data_cost: 0.0014 ips: 7.9396 images/s,...

CashBai

数据校验失败

1

## Checklist: - [ ] 查找[历史相关issue](https://github.com/PaddlePaddle/PaddleX/issues)寻求解答 - [ ] 翻阅[FAQ](https://paddlepaddle.github.io/PaddleX/main/FAQ.html) - [ ] 翻阅[PaddleX 文档](https://paddlepaddle.github.io/PaddleX/main/index.html) - [ ] 如果是数据校验问题，请确保在开源PaddleX中可以通过数据校验 ## 描述问题 2025-05-09 10:10:14,834 - pp-pipeline-exec - INFO - u-15431615-pp-p-9f232fa769b6-tt-9f2331e23c0b 2025-05-09...

early-worm-bird

PaddleX时序预测，怎么修改输入和输出序列长度

1

使用官方提供的模型进行推理，怎么修改输入输出序列的长度，yaml中的文件只能是输入96，输出96，修改就会报错，

zxt6174

PaddleX
PaddleX copied to clipboard

Metadata

版面区域检测模块以API启动时layout_threshold不支持以字典形式给不同目标类型不同的阈值

aarch64 cpu未支持onnxruntime

[Feat][Experimental] Support parallel computing (embarassingly parallel)

通用OCR产线执行速度慢

PP-ChatOCRv4 怎么调用本地部署的大模型

训练image_anomaly_detection时报错

昇腾910使用table_recognition产线出现错误。

小目标检测训练过程中报错

数据校验失败

PaddleX时序预测，怎么修改输入和输出序列长度

← Metadata

Owner

Metadata

PaddleX PaddleX copied to clipboard

Metadata

← Metadata

Owner

Metadata

PaddleX
PaddleX copied to clipboard