zhaoyuchen2018
zhaoyuchen2018
Profile MobilenetV1 to optimize depthwise conv.
模型提供的测试报告:  V100 单机单卡自测值: paddle 版本:develop 速度:0.961218 steps/s tf 1.15 速度: 1.61 step/s
#### 负责人 @zhaoyuchen2018 , @luotao1 #### 初始性能 - 测试时间:2019年7月15日 - Paddle commit: - 模型配置: - 单机单线程:CPU_NUM=1,1个进程读数据 - 测试者:@Aurelius84 - 单位:s/epoch - CPU型号:Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz | epoch...
- 负责人: zhaoyuchen - 测试环境 - 显卡驱动:418.39 - CUDA 9.0 CUDNN7 - 当前性能对比 CUDA90 backbone:resnext 场景 | Paddle | pytorch | 对比 ---|---|---|--- 单GPU | 2.601 | 3.035 | 差于...