continuous_evaluation
continuous_evaluation copied to clipboard
Macro Continuous Evaluation Platform for Paddle.
CE 模型重构
目前一个模型目录中, 所有gpu,cpu场景都配置在里面。 导致其中kpi相关配置,以及model中记录kpi的变量越来越多。 比如: 加一个4卡和8卡 需要把kpi配置, 启动脚本等,都平铺开来。 data:image/s3,"s3://crabby-images/e9114/e9114e4e22c277e827056421bac7318da24d9d02" alt="aa" https://github.com/PaddlePaddle/paddle-ce-latest-kpis/pull/37 随着我们机器型号和模型场景(Gpu单卡、多卡,cpu等)不断扩充, 维护起来比较费劲。 ### 计划进行如下重构: 每一个模型有一个对应的base模型: ```sh resnet50 ``` base模型里存放的内容有: model.py(模型脚本), continuous_evaluation.py (kpi 变量), 所有模型共用。 可以在此基础上定义各种场景模型 ```sh resnet50-p40-card8 resnet50-p40-card4 resnet50-p40-card1 resnet50-v100-card4 resnet50-v100-card1...
1. commit details 和 compare页面不加cache。 如果用户请求了一个commit detail页面后再请求另一个commit detail页面,因为缓存的存在,会导致用户看到的页面信息和实际对不上。 而且这个响应时间本来比较短,可以不加缓存 data:image/s3,"s3://crabby-images/018f5/018f548fdfcc50501a053dbaf561c9411f69543d" alt="details" 2. compare 显示的commit id信息,目前没有顺序 计划将新的commit 显示在上面,老commit在下面的顺序排列,方便选择 3. 对于后来加的模型,以及后来模型新加的kpis, 需要判断是否两个commit都有相应的task或kpi,否则会key error data:image/s3,"s3://crabby-images/0b17f/0b17fd83c7da6a6961effa7d66ec086f7cd99162" alt="code" 例如,选择两个commit 比较,ce server报错: data:image/s3,"s3://crabby-images/8b4ab/8b4abd0f512e12c2160fd34d8a54d042f1900688" alt="error"
CE db优化
原来CE模型设置的merge监控,模型需要merge到CE模型库才能暴露问题。 本周增加CE 模型repo PR的监控告警。这样能够保证模型在merge到CE模型库之前 是功能正确,并且阈值在范围内. 栗子: https://github.com/Superjomn/paddle-ce-latest-kpis/pull/33 效果如下: data:image/s3,"s3://crabby-images/6dba2/6dba256b42e5797b38d41fc11858bc8158909231" alt="image" 点击"details" http://18.222.34.7:8080/viewLog.html?buildId=450&buildTypeId=Paddle_CeTaskEvaluation
CE模型对齐
CE模型添加多卡支持,待验证Model CE多卡加速比指标
需要验证模型的 CPU 性能,精度,尽量调小阈值,达到可以检测代码库的效果
确定稳定的模型,如下阈值确定设置合理: - diff ratio - update ratio - actived 方便值班追踪 Paddle 代码质量
目前 有些模型中pass num参数没有用到,