zhaoyuchen2018

Results 4 issues of zhaoyuchen2018

Profile MobilenetV1 to optimize depthwise conv.

模型提供的测试报告: ![image](https://user-images.githubusercontent.com/45989343/71142692-19e09500-2253-11ea-99d1-243ec67a5864.png) V100 单机单卡自测值: paddle 版本:develop 速度:0.961218 steps/s tf 1.15 速度: 1.61 step/s

#### 负责人 @zhaoyuchen2018 , @luotao1 #### 初始性能 - 测试时间:2019年7月15日 - Paddle commit: - 模型配置: - 单机单线程:CPU_NUM=1,1个进程读数据 - 测试者:@Aurelius84 - 单位:s/epoch - CPU型号:Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz | epoch...

- 负责人: zhaoyuchen - 测试环境 - 显卡驱动:418.39 - CUDA 9.0 CUDNN7 - 当前性能对比 CUDA90 backbone:resnext 场景 | Paddle | pytorch | 对比 ---|---|---|--- 单GPU | 2.601 | 3.035 | 差于...