PaddleX icon indicating copy to clipboard operation
PaddleX copied to clipboard

paddlex restful 持续往tmp 写入文件导致训练效率低下

Open dwSun opened this issue 4 years ago • 6 comments

paddlex restful 训练模型的过程中,持续往 tmp 里面写入大量文件,在 tmp 挂载到普通磁盘的情况下,会导致训练效率低下。 image

dwSun avatar Sep 13 '21 02:09 dwSun

辛苦提供下paddlex和paddlepaddle_gpu的版本号

FlyingQianMM avatar Sep 13 '21 02:09 FlyingQianMM

辛苦提供下paddlex和paddlepaddle_gpu的版本号

paddlehub 1.8.3 paddlepaddle-gpu 2.1.2.post112 paddleslim 1.1.1 paddlex 1.3.4

dwSun avatar Sep 13 '21 03:09 dwSun

我看这个临时文件都是pymp开头,应该都是python的多进程产生的,你现在的起paddlex的机器是linux系统吗?

FlyingQianMM avatar Sep 17 '21 02:09 FlyingQianMM

我们实测了下,没有复现出<tmp下有大量文件写入>的情况。

关于您提到的<tmp下有大量文件写入>的情况,想再了解一下您当前的使用情况:

  1. 您这边使用paddlex restful api的前端是paddlex提供html demo还是paddlex gui?还是自行开发的前端?
  2. 从提供的tmp目录下看,看起来是多进程通信产生的文件。是否有基于paddlex restful api再做进一步的开发?有没有使用多个client请求同一个server的情况?或者其他的多进程开发?

FlyingQianMM avatar Sep 28 '21 12:09 FlyingQianMM

pdx_train.zip

这个是我训练用的脚本,直接拿了 paddlex 里面代码做了一些修改。

dwSun avatar Nov 03 '21 08:11 dwSun

看了下你的脚本,跟PaddleX原本的差不多。

关于您提到的<tmp下有大量文件写入>的情况,想再了解一下您当前的使用情况:

  1. 您这边使用paddlex restful api的前端是paddlex提供html demo还是paddlex gui?还是自行开发的前端?
  2. 从提供的tmp目录下看,看起来是多进程通信产生的文件。是否有基于paddlex restful api再做进一步的开发?有没有使用多个client请求同一个server的情况?或者其他的多进程开发?

建议从前端这里排查下问题

FlyingQianMM avatar Nov 05 '21 02:11 FlyingQianMM