Paddle
Paddle copied to clipboard
【Hackathon 7th】开源贡献个人挑战赛(偷跑版)
大家好!很高兴向大家宣布,第七期 PaddlePaddle Hackathon 正在紧锣密鼓地筹备中,活动预计将在 9 月 10 日 正式上线🔥。为了让迫不及待的开发者们提前体验本次黑客松的精彩内容,我们计划“偷跑”部分赛题。此次提前发布的赛题主要围绕 “科学计算模型复现” 方向展开,欢迎大家提前报名认领并参与开发!
此 issue 发布 开源贡献个人挑战赛(偷跑版) 的任务,以开源贡献为核心,开发者使用 GitHub ID 报名,独立完成具有明确验收目标的贡献任务,获得对应的任务奖励,奖金 1-3 🌟。 详细信息参考往期的第六期黑客松开源贡献个人挑战赛活动说明。
报名格式参考:【报名】:2、3,多个任务之间需要使用中文顿号分隔,报名多个连续任务可用横线表示,如 2-5
RFC&PR 提交格式:在 PR 的标题中以 【Hackathon 7th No.xxx】 开头,注明任务编号
[!IMPORTANT]
⚠️ 部分任务无需提交 RFC 即可直接进行开发,请查询 RFC 需求列表 确认具体要求。
科学计算模型复现任务
科学计算方向的论文复现,需要严格参考 https://paddlescience-docs.readthedocs.io/zh-cn/latest/zh/reproduction/ ,并合入PaddleScience
看板信息
| 任务方向 | 任务数量 | 提交作品 / 任务认领 | 提交率 | 完成 | 完成率 |
|---|---|---|---|---|---|
| 【个人挑战赛】科学计算 | 17 | 1 / 7 | 5.88% | 0 | 0.0% |
统计信息
排名不分先后
科学计算方向的论文复现,需要严格参考 https://paddlescience-docs.readthedocs.io/zh-cn/latest/zh/reproduction/ ,并合入PaddleScience
【报名】:2
【报名】:7
【报名】:13
【报名】:1
【报名】:2
【报名】:2、5、7、9
【报名】:8
【报名】:12
【报名】:12
【报名】:4
【报名】:8
【报名】:3、4
【报名】:11
【报名】:16
【报名】:9
请问复现指标有些指标相对误差满足10%的要求,有些不满足10%的要求时如何判定?公式是(复现指标-源论文指标)/源论文指标<10%,感觉这样的判断方式有缺陷,假设复现指标是0.8,源论文指标是0.75,那么相对误差则是0.06;假设复现指标是0.15,源论文指标是0.10,那么相对误差则是0.5>10%,该公式使用的是相对误差,但在某些情况下,绝对误差可能更有意义。例如,当源论文指标非常接近零时,即使是微小的绝对误差也会导致相对误差非常大。一点建议。
请问复现指标有些指标相对误差满足10%的要求,有些不满足10%的要求时如何判定?公式是(复现指标-源论文指标)/源论文指标<10%,感觉这样的判断方式有缺陷,假设复现指标是0.8,源论文指标是0.75,那么相对误差则是0.06;假设复现指标是0.15,源论文指标是0.10,那么相对误差则是0.5>10%,该公式使用的是相对误差,但在某些情况下,绝对误差可能更有意义。例如,当源论文指标非常接近零时,即使是微小的绝对误差也会导致相对误差非常大。一点建议。
是的,我们会根据实际题目和选手提供的精度具体数值进行判断,可以在在回复中提供一下具体的精度信息吗?
Model | Shape-Net-Car | | | | 复现指标
volume | surf | Cd | ρd |
Transolver | 0.0221 | 0.0797 | 0.0134 | 0.9902 |
相对误差 | 0.06763 | 0.0698 | 0.301 | -0.003 |
Model | Shape-Net-Car | | | | 源指标
| volume | surf | Cd | ρd |
Transolver | 0.0207 | 0.0745 | 0.0103 | 0.9935 |
非常感谢你的回复,上面仅展示复现的一个数据集结果,其他数据集也是大差不差,如果这个没问题的话其他应该也没问题
另外关于DrivAerNet++的复现,原论文batch_size为32,我这边由于服务器是实验室一起用的,先跑了个batch_size为4的,效果如下 PointNet: Test MSE: 0.000665, Test MAE: 0.021250, Max MAE: 0.048836 复现指标 Test MSE: 0.000149 Test MAE: 0.009600, Max MAE: 0.012450 源论文指标
Model | Shape-Net-Car | | | | 复现指标 volume | surf | Cd | ρd | Transolver | 0.0221 | 0.0797 | 0.0134 | 0.9902 | 相对误差 | 0.06763 | 0.0698 | 0.301 | -0.003 |
Model | Shape-Net-Car | | | | 源指标 | volume | surf | Cd | ρd | Transolver | 0.0207 | 0.0745 | 0.0103 | 0.9935 |
非常感谢你的回复,上面仅展示复现的一个数据集结果,其他数据集也是大差不差,如果这个没问题的话其他应该也没问题
另外关于DrivAerNet++的复现,原论文batch_size为32,我这边由于服务器是实验室一起用的,先跑了个batch_size为4的,效果如下 PointNet: Test MSE: 0.000665, Test MAE: 0.021250, Max MAE: 0.048836 复现指标 Test MSE: 0.000149 Test MAE: 0.009600, Max MAE: 0.012450 源论文指标
- 第一个ShapeNetCar看起来没太大问题呢。
- 第二个DrivAerNet++看起来精度差别还是比较大的,可以确认下如果模型中没有BN这种带有历史统计的层,可以尝试使用梯度累加(https://paddlescience-docs.readthedocs.io/zh-cn/latest/zh/user_guide/#24)来训练;另外如果手头算力不太够,可以使用AIStudio进行训练,我们可以帮助申请ATStudio32G的资源
非常感谢你提供关于”BN这种带有历史统计的层“这一点的知识信息,感谢你提供关于GPU申请的事项,目前我这边算力足够,等其他跑完我就可以跑了。
非常感谢你提供关于”BN这种带有历史统计的层“这一点的知识信息,感谢你提供关于GPU申请的事项,目前我这边算力足够,等其他跑完我就可以跑了。
训练对齐的话尽量保证batchsize相同,否则梯度累加也不能做到与原batch size完全等价
第七期飞桨黑客松已于2025 年 1 月 14 日正式结束~ 🎉衷心感谢各位开发者的热情参与,希望未来也能一同共建飞桨开源社区