Paddle 【Hackathon 7th】开源贡献个人挑战赛（偷跑版）

大家好！很高兴向大家宣布，第七期 PaddlePaddle Hackathon 正在紧锣密鼓地筹备中，活动预计将在 9 月 10 日 正式上线🔥。为了让迫不及待的开发者们提前体验本次黑客松的精彩内容，我们计划“偷跑”部分赛题。此次提前发布的赛题主要围绕 “科学计算模型复现” 方向展开，欢迎大家提前报名认领并参与开发！

此 issue 发布 开源贡献个人挑战赛（偷跑版） 的任务，以开源贡献为核心，开发者使用 GitHub ID 报名，独立完成具有明确验收目标的贡献任务，获得对应的任务奖励，奖金 1-3 🌟。 详细信息参考往期的第六期黑客松开源贡献个人挑战赛活动说明。

报名格式参考：【报名】：2、3，多个任务之间需要使用中文顿号分隔，报名多个连续任务可用横线表示，如 2-5

RFC&PR 提交格式：在 PR 的标题中以【Hackathon 7th No.xxx】开头，注明任务编号

[!IMPORTANT]

⚠️ 部分任务无需提交 RFC 即可直接进行开发，请查询 RFC 需求列表确认具体要求。

科学计算模型复现任务

科学计算方向的论文复现，需要严格参考 https://paddlescience-docs.readthedocs.io/zh-cn/latest/zh/reproduction/ ，并合入PaddleScience

序号	难度	任务标题	队伍名称/状态/PR
1	⭐️	为开源符号回归库进行paddle适配	@AndPuQing https://github.com/MilesCranmer/PySR/pull/704
2	⭐️⭐️	Transolver 论文复现	@xusuyong @LilaKen @lijiawei20161002
3	⭐️⭐️	DrivAerNet ++ 论文复现
4	⭐️⭐️	DrivAerNet 论文复现
5	⭐️⭐️	Hidden fluid mechanics: Learning velocity and pressure fields from flow visualizations 论文复现	@lijiawei20161002
6	⭐️⭐️	Synthetic Lagrangian turbulence by generative diffusion models 论文复现
7	⭐️⭐️	AI-aided geometric design of anti-infection catheters 论文复现	@ADream-ki @lijiawei20161002
8	⭐️⭐️	A physics-informed diffusion model for high-fidelity flow field reconstruction 论文复现	@ADream-ki
9	⭐️	DiffCast: A Unified Framework via Residual Diffusion for Precipitation Nowcasting 论文复现	@lijiawei20161002
10	⭐️⭐️	Neural General Circulation Models for Weather and Climate 论文复现
11	⭐️	FuXi: A cascade machine learning forecasting system for 15-day global weather forecast 论文复现
12	⭐️⭐️	Adam、AdamW优化器支持amsgrad
13	⭐️⭐️	put_along_axis反向算子实现静态图一阶拆解	@zeroRains
14	⭐️⭐️	Crystal Diffusion Variational AutoEncoder论文复现
15	⭐️⭐️	SchNet论文复现
16	⭐️⭐️⭐️	MACE论文复现
17	⭐️⭐️	PIKAN论文复现

看板信息

任务方向	任务数量	提交作品 / 任务认领	提交率	完成	完成率
【个人挑战赛】科学计算	17	1 / 7	5.88%	0	0.0%

统计信息

排名不分先后

Aug 21 '24 06:08 sunzhongkai588

科学计算方向的论文复现，需要严格参考 https://paddlescience-docs.readthedocs.io/zh-cn/latest/zh/reproduction/ ，并合入PaddleScience

Aug 21 '24 07:08 wangguan1995

【报名】：2

Aug 23 '24 03:08 xusuyong

【报名】：7

Aug 23 '24 10:08 ADream-ki

【报名】：13

Aug 23 '24 10:08 zeroRains

【报名】：1

Aug 23 '24 13:08 AndPuQing

【报名】：2

Aug 27 '24 06:08 LilaKen

【报名】：2、5、7、9

Aug 27 '24 08:08 lijiawei20161002

【报名】：8

Aug 27 '24 09:08 ADream-ki

【报名】：12

Aug 29 '24 05:08 idontkonwher

【报名】：12

Aug 29 '24 15:08 megemini

【报名】：4

Aug 30 '24 11:08 NKNaN

【报名】：8

Sep 07 '24 02:09 AI1LJW

【报名】：3、4

Sep 18 '24 13:09 LilaKen

【报名】：11

Sep 25 '24 11:09 haoyu2022

【报名】：16

Oct 24 '24 10:10 LilaKen

【报名】：9

Oct 26 '24 05:10 a162837

请问复现指标有些指标相对误差满足10%的要求，有些不满足10%的要求时如何判定？公式是(复现指标-源论文指标)/源论文指标<10%,感觉这样的判断方式有缺陷，假设复现指标是0.8，源论文指标是0.75，那么相对误差则是0.06；假设复现指标是0.15，源论文指标是0.10，那么相对误差则是0.5>10%,该公式使用的是相对误差，但在某些情况下，绝对误差可能更有意义。例如，当源论文指标非常接近零时，即使是微小的绝对误差也会导致相对误差非常大。一点建议。

Oct 28 '24 04:10 LilaKen

请问复现指标有些指标相对误差满足10%的要求，有些不满足10%的要求时如何判定？公式是(复现指标-源论文指标)/源论文指标<10%,感觉这样的判断方式有缺陷，假设复现指标是0.8，源论文指标是0.75，那么相对误差则是0.06；假设复现指标是0.15，源论文指标是0.10，那么相对误差则是0.5>10%,该公式使用的是相对误差，但在某些情况下，绝对误差可能更有意义。例如，当源论文指标非常接近零时，即使是微小的绝对误差也会导致相对误差非常大。一点建议。

是的，我们会根据实际题目和选手提供的精度具体数值进行判断，可以在在回复中提供一下具体的精度信息吗？

Oct 28 '24 05:10 HydrogenSulfate

Model | Shape-Net-Car | | | | 复现指标 volume | surf | Cd | ρd |
Transolver | 0.0221 | 0.0797 | 0.0134 | 0.9902 |
相对误差 | 0.06763 | 0.0698 | 0.301 | -0.003 |

Model | Shape-Net-Car | | | | 源指标
| volume | surf | Cd | ρd |
Transolver | 0.0207 | 0.0745 | 0.0103 | 0.9935 |

非常感谢你的回复，上面仅展示复现的一个数据集结果，其他数据集也是大差不差，如果这个没问题的话其他应该也没问题

另外关于DrivAerNet++的复现，原论文batch_size为32，我这边由于服务器是实验室一起用的，先跑了个batch_size为4的，效果如下 PointNet： Test MSE: 0.000665, Test MAE: 0.021250, Max MAE: 0.048836 复现指标 Test MSE: 0.000149 Test MAE: 0.009600, Max MAE: 0.012450 源论文指标

Oct 28 '24 06:10 LilaKen

Model | Shape-Net-Car | | | | 复现指标 volume | surf | Cd | ρd | Transolver | 0.0221 | 0.0797 | 0.0134 | 0.9902 | 相对误差 | 0.06763 | 0.0698 | 0.301 | -0.003 |

Model | Shape-Net-Car | | | | 源指标 | volume | surf | Cd | ρd | Transolver | 0.0207 | 0.0745 | 0.0103 | 0.9935 |

非常感谢你的回复，上面仅展示复现的一个数据集结果，其他数据集也是大差不差，如果这个没问题的话其他应该也没问题

另外关于DrivAerNet++的复现，原论文batch_size为32，我这边由于服务器是实验室一起用的，先跑了个batch_size为4的，效果如下 PointNet： Test MSE: 0.000665, Test MAE: 0.021250, Max MAE: 0.048836 复现指标 Test MSE: 0.000149 Test MAE: 0.009600, Max MAE: 0.012450 源论文指标

第一个ShapeNetCar看起来没太大问题呢。
第二个DrivAerNet++看起来精度差别还是比较大的，可以确认下如果模型中没有BN这种带有历史统计的层，可以尝试使用梯度累加（https://paddlescience-docs.readthedocs.io/zh-cn/latest/zh/user_guide/#24）来训练；另外如果手头算力不太够，可以使用AIStudio进行训练，我们可以帮助申请ATStudio32G的资源

Oct 28 '24 06:10 HydrogenSulfate

非常感谢你提供关于”BN这种带有历史统计的层“这一点的知识信息，感谢你提供关于GPU申请的事项，目前我这边算力足够，等其他跑完我就可以跑了。

Oct 28 '24 06:10 LilaKen

非常感谢你提供关于”BN这种带有历史统计的层“这一点的知识信息，感谢你提供关于GPU申请的事项，目前我这边算力足够，等其他跑完我就可以跑了。

训练对齐的话尽量保证batchsize相同，否则梯度累加也不能做到与原batch size完全等价

Oct 28 '24 06:10 HydrogenSulfate

第七期飞桨黑客松已于2025 年 1 月 14 日正式结束～ 🎉衷心感谢各位开发者的热情参与，希望未来也能一同共建飞桨开源社区

Jan 14 '25 09:01 sunzhongkai588

Paddle Paddle copied to clipboard

【Hackathon 7th】开源贡献个人挑战赛（偷跑版）

科学计算模型复现任务

看板信息

统计信息

Paddle
Paddle copied to clipboard