PaddleX icon indicating copy to clipboard operation
PaddleX copied to clipboard

使用paddlex训练ppocrv5的文本检测模型速度很慢

Open ChaoII opened this issue 3 months ago • 2 comments

我在使用paddlex进行ppocrv5的文本检测模型时,模型的训练过程很快,但是在每一个epoch完成后,进行eval很慢,一张图片需要接近5秒钟,我目前是一个测试的小规模数据集,val集只有11张图片,但是要等很久,在eval的过程中,GPU占用为0,CPU占用也很低,下面这张图是训练时GPU占用情况,验证集一张图可能有大几十到100多个bbox不等

Image 图中在很小规模数据集上训练测试的时候,训练(反向传播)阶段占用时间很短,大量的时间在评估,并且评估也没咋吃GPU,CPU也没咋吃,咋回事,评估过程中做了哪些操作?

ChaoII avatar Sep 17 '25 09:09 ChaoII

能发一下你的训练配置文件吗?另外,你的验证集中的图像分辨是不是很大呀

leo-q8 avatar Oct 20 '25 12:10 leo-q8

能发一下你的训练配置文件吗?另外,你的验证集中的图像分辨是不是很大呀

你好,我的训练脚本:

python main.py -c paddlex/configs/modules/text_detection/PP-OCRv5_mobile_det.yaml ^
-o Global.output=F:/unattended_laboratory/OCR/det/checkpoint ^
-o Global.device=gpu:0 ^
-o Global.mode=train ^
-o Global.dataset_dir=F:/unattended_laboratory/OCR/det/dataset

我的验证集中的图片是1920x1080分辨率的,就是电脑的截屏然后检测屏幕上的文字。

ChaoII avatar Nov 05 '25 01:11 ChaoII