关于在 CCF 数据库专委会设立并推动开源数据库领域拔尖创新人才培育计划
2024 年,随着 CCF 数据库专委会进入到一个新的发展阶段、开放原子开源教育、天工开物开源教育的新年规划、以及各国产数据库产业端(TiDB、OceanBase、PolarDB、IoTDB、TuGraph 等)的新发展,特此提出依托 CCF 数据库专委会,设立并推动“开源数据库领域拔尖创新人才培育计划”。
总体目标:
- 以 CCF 高校端资源与渠道为依托,以开源生态与社区为组织运营模式,以开源数据库技术与项目为实践载体,形成“产-教-研-用”闭环,大力培育开源数据库领域拔尖创新人才。
- 产业端:遴选优质的数据库领域开源项目,开展教学法加工与科研问题凝练,通过各种形式投放到高校端;
- 教育端:与产业界联合创作、改造、优化具有教学属性的开源项目,引导师生积极参与,并设计反馈与激励闭环;
- 科研端:与产业界联合创作、改造、优化具有科研属性的开源项目,引导师生积极参与,并设计反馈与激励闭环;
- 应用端:通过不同的方式,将产教端联合开发的成果,进行社会化、行业化、全球化推广,大力推动创新应用与落地场景的拓展,持续提升影响力;
- 国际社会端:开展广泛合作,连接各利益共同体,全球化协同发展。
行动框架:
- 组织架构:在数据库专委会下成立“开源数据库人才培育工作组”,以类似基金会 TOC 的模式进行运作;
- 品牌项目:从工业界与学术界征集优质的数据库(数据科学)领域开源项目,捐赠或托管到专委会旗下,设立统一的品牌,依托工作组开展日常教学与科研活动运营;
- 专委活动:通过专委会旗下的暑期学校、走进高校、黑客马拉松、数据库年会等常态化活动,联合推动上述事务;
- 激励机制:基于开源贡献度评价,打通“企业-专委会-高校师生”的激励链路,同时基于贡献度评价,推动高校端的评价机制改革与成果认定工作。
资源流动路径:企业捐赠 --> CCF 数据库专委会 / 中国开源软件教育基金(ECNU)--> 高校师生
基于上述内容,规划 2024 年度具体工作任务(上述框架的实例化),包括:
- 2 ~ 3 月:顶层设计、利益相关方共识、企业预算、工作机制设定;
- 3 ~ 4 月:数据库领域教育开源项目(EOSS)遴选,教学法加工与改造;
- 5 月:上线开源贡献度评价公共服务平台(OpenShare);
- 5 ~ 6 月:走进高校活动,开源教育通识课 + EOSS 教学实践 + ROSS 科研创新;
- 7 ~ 8 月:数据库领域编程之夏活动(联合OSPP),VLDB暑期学校等活动;
- 9 ~ 12 月:第二轮“培训 - 项目 - 激励”;
- 10 月:CCF 中国数据库学术会议(NDBC 2023),各类活动、发布、颁奖等;
- 11 月:中国计算机大会(CNCC2023),通过论坛进行总结与研讨。
几个关键点的设想:
0、品牌设计
- CCF 中国数据库学术会议:NDBC(已有)
- VLDB 暑期学校:VLDB Summer School(已有)
- 开源数据库领域拔尖创新人才培育计划:OpenTalent(新建)
1、数据库(数据科学)领域候选课程(开源实训)
- OpenTalent 101 课程:OSS101(已有,2024 版 3 月份授课)
- OpenTalent 301 课程:TinySQL(已有)
- OpenTalent 302 课程:TinyKV(已有)
- OpenTalent 303 课程:MiniOB(已有)
2、数据库(数据科学)领域候选项目(社区实习)
- TiDB(PingCAP),关系数据库,对应 OpenTalent 301 课程
- TiKV(PingCAP),键值数据库,对应 OpenTalent 302 课程
- OceanBase(蚂蚁),关系数据库,对应 OpenTalent 303 课程
- PolarDB(阿里),关系数据库,暂无对应实训课程
- IoTDB(清华),时序数据库,暂无对应实训课程
- OpenDigger(华师),数据挖掘与分析,暂无对应实训课程
- HyperCRX(华师),数据可视化,暂无对应实训课程
- OSS Insight(PingCAP),数据可视化,暂无对应实训课程
- TuGraph(蚂蚁),图数据库,暂无对应实训课程
- EasyGraph(复旦),图数据分析,暂无对应实训课程
3、数据库(数据科学)领域候选竞赛(科研创新)
- OpenSODA(华师):OpenDigger 开源挑战赛
- OpenPerf(华师):面向开源生态可持续发展的数据科学基准测试体系
4、评测与认证(评价机制)
- OpenRank(华师):开源贡献度评价方法
-
OpenLeaderboard(华师):开源排行榜
- 墨天轮排行榜,PolarDB 的关注
- DB-Engines 排行榜,PingCAP 的关注
- OpenLeaderboard + BenchCouncil --> 国际权威开源数据库排行榜
5、高校政策与激励机制设计
- 课程融合
- 课程学分兑换
- 实习学分兑换
- 小论文兑换
- 评奖学金
- 保研加分
以 PingCAP 合作为例:
-
第一、华东师范大学联合 PingCAP 发起“开源数据库领域拔尖创新人才培育计划(OpenTalent)”
-
第二、在 CCF 数据库专委会下成立“开源数据库人才培育工作组”,邀请国内外著名数据库专家,共同运营 OpenTalent 项目:
- 治理架构:参考基金会 TOC 架构进行设计
- 工作职责:教育开源项目(EOSS)的遴选、孵化、运营、推广
- 候选人员:专委会主任 + 专委会专家 + 业界专家
-
第三、遴选包括 TiDB、TiKV、OpenDigger、HyperCRX 等首批教育开源项目入驻专委会 OpenTalent 计划:
-
第四、PingCAP 资助 OpenTalent 计划,开展包括 VLDB 暑期学校、开源之夏(OSPP)、CCF 走进高校、CCF 黑客马拉松、NDBC 等推广活动
- CCF 走进高校:每个月一期,宣传 OpenTalent 计划
- VLDB 暑期学校:线上线下混合 TinySQL 和 TinyKV 开源项目实训
- 开源之夏(OSPP):TiDB 与 TiKV 开源社区实习(基于 OpenRank 的开源贡献度核算)
- NDBC / 黑客马拉松 / 科研竞赛:基于 TiDB 与 TiKV 的应用创新与科研创新竞赛
-
第五、通过 OpenShare 平台进行 OpenRank 开源贡献度核算,并和竞赛、奖学金、保研等事项挂钩
- 成立"高校开源数据库拔尖创新人才培育联盟"
- 设立高校开源数据库拔尖创新人才培育教学金 / 奖教金
- 联盟内高校互认 OpenRank 开源贡献度评价,并和推免保研、教学金 / 奖教金的评定等工作挂钩
-
第六、上线包括“开源数据库国际排行榜”、“高校开源数据库贡献排行榜” 信息服务
- 开源数据库国际排行榜:OpenDigger + OpenLeaderboard + BenchCouncil(国际化)
- 高校开源数据库贡献排行榜:OpenDigger + OpenShare(高校评价服务)
-
第七、成果产出
- 人才培育:培育一批具备 TiDB、TiKV 数据库开发能力的拔尖人才(开源实训 + 专委推广)
- 代码贡献:TiDB、TiKV 开源社区的代码贡献(社区实习 + 激励机制 + 专委推广)
- 用户创新:基于 TiDB、TiKV 产品的创意作品(创新大赛 + 专委推广)
- 权威测评:基于国家标准的开源项目与产品测评与认证(权威标准 + 专委背书)
- 品牌宣传:大幅提升 TiDB、TiKV 等品牌的市场声量(专业运营 + 专委推广)