Weihang Chen
Weihang Chen
### PR types Others ### PR changes Others ### Describe Polish backend and layout details
Add phi design en doc
### PR types New features ### PR changes Others ### Describe Adapting device-specific Extra Attributes for the PHI kernel
### PR types Bug fixes ### PR changes Others ### Describe Fix libpaddle soname mismatch error cmake会默认为shared library加前缀,因此多了一个前缀,还是会出现soname不一致的问题,本PR修复一下 修复前:  修复后: 
### PR types New features ### PR changes Others ### Describe Enable eager mode on xpu
2020 Q1对动态图DataLoader进行了第二阶段优化: - 原理:主要是通过共享内存和序列化LoDTensor进一步减少主进程附属读取线程的开销,将更多工作移到子进程中执行 - 效果:通过此项优化,大多数情况下,主进程中读取下一批数据的时间降到0.0001 s左右,读取数据几乎不再引入负担(数据读取及预处理负担较重时,建议结合fluid.io.xmap_reader使用进一步提升速度) - PR:https://github.com/PaddlePaddle/Paddle/pull/22541 目前该PR已经Merge到develop中,现基于(Paddle v1.7分支)以及(develop分支)进行优化效果对比测试与整体测试。 ### 一. 测试项点: #### 1. 性能测试 0. DataLoader数据传输前后的一致性(上次天宇测试过,复用即可,这里不介绍此项) 1. 使用本次优化后多进程DataLoader,相比使用上次优化后的多进程DataLoader的整体训练速度提升 2. 使用本次优化后多进程DataLoader,相比使用普通reader或单进程DataLoader的整体训练速度提升 3. 使用本次优化后多进程DataLoader,动态图与静态图在相同模型(mobilenet v1)上的训练速度对比 #### 2. 稳定性测试(在性能测试时同步确认即可) 1....
动态图DataLoader这段时间进行了两次优化: - **优化1**:https://github.com/PaddlePaddle/Paddle/pull/21634 - 去掉了一些原DataLoader不合理的实现,个人测试ResNet整体训练提速6.2%(相对于使用优化前DataLoader) - **优化2**:https://github.com/PaddlePaddle/Paddle/pull/21762 - 用子进程加速数据的载入过程,个人测试ResNet累计整体提速32.2%(相对于使用优化前DataLoader) 目前这两次优化的PR均已Merge到develop,现在根据最新的代码对这两次优化进行整体效果测试(验证结果以本次测试为准)。 ### 测试方法: 1. 拉取models repo,然后拉取本PR所在分支至当前models repo(本人测试的models版本号:109a3c7,如果有冲突,可以考虑切换到此分支,或手动解决) 2. 返回dygraph目录下,执行dataloader_test.sh,等待测试结果 3. 执行parse_dataloader_test_result.py,将结果输出至终端,对比分析 ### 个人测试过程概述: 1. 基于models/dygraph下面mnist, resnet, se_resnet, transformer共4个模型进行测试 2. 将上述所有模型代码中epoch数改为1,缩短测试时间,其他参数保持不变 3....