PaddleX
PaddleX copied to clipboard
PaddleX 快乐开源活动 (2025 H1)
trafficstars
📣PaddleX 快乐开源活动
旨在鼓励更多的开发者参与到飞桨低代码开发工具的开源建设中,帮助社区修复 bug 或贡献 feature,共建飞桨。
🌈命题任务
命题任务是我们总结整理PaddleX的需求得出,每个任务上标注了任务难度,大家可以选择参与。欢迎对这些需求感兴趣的开发者参与到这些任务的开发✌️✌️。在开发过程中,你能进行包括任务分解、代码撰写等工作,还会有飞桨的研发全程和你一起解决可能遇到的问题。还等什么,快来参与吧。🎉🎉
认领方式
请大家以 comment 的形式认领任务,如:
【报名】:1、3、2-3
- 多个任务之间需要使用中文顿号分隔,报名多个连续任务可用横线表示,如 1-2
- PR 提交格式:在 PR 的标题中以 【PaddleX No.xxx】 开头,注明任务编号
任务列表
PaddleX基础能力
mentor @changdazhou @openvino-book 1 @TingquanGao 2 @leo-q8 3 @zhangyubo0722 4、6 @BluebirdStory 5
| 序号 | 任务名称 | 任务类型 | 任务描述 | 难度 | 优先级 | 认领人/状态/PR号 |
|---|---|---|---|---|---|---|
| 1 | PaddleX文档优化 | 文档建设 | 1. 优化PaddleX现有的文档文字描述,优化站点文档;2.整理和优化PaddleX的FAQ模块;3.增加VisualDL等文档的描述 | 🌟 | P0 | @Echo-Nie |
| 2 | PaddleX推理能力测试 | 训推能力建设 | 基于PaddleX现有的单模型和模型产线,在不少于10种不同软硬件平台测试推理的功能稳定性和正确性 | 🌟 | P0 | |
| 3 | OCR类产线的web端demo展示搭建 | 前后端开发 | 搭建不少于5个重要OCR类产线的web端demo应用 | 🌟 | P0 | |
| 4 | OCR类模型的量化训练适配 | 训推能力建设 | 跑通不少于5个重要的OCR类模型的模型量化能力,精度和FP32对齐 | 🌟🌟 | P1 | |
| 5 | 数据标注流程打通 | 训推能力建设 | 将LabelStudio等标注软件和PaddleX现有的数据要求完全打通,可以产出符合PaddleX格式的标注数据,并打通自动化标注流程(包括加载PaddleX产出的模型权重或者预标注文件) | 🌟🌟 | P1 | @kaori-seasons |
| 6 | 数据分析 | 训推能力建设 | 增强当前PaddleX的训练数据分析的分析能力,美化输出结果 | 🌟 | P2 |
PaddleX特色能力
mentor @changdazhou 7 @TingquanGao 8、9
| 序号 | 任务名称 | 任务类型 | 任务描述 | 难度 | 优先级 | 认领人/状态/PR号 |
|---|---|---|---|---|---|---|
| 7 | 基于版面解析和大语言模型的文档翻译能力建设 | 特色能力 | 基于PaddleX版面解析V3(PP-StructureV3)产线,结合大语言模型,支持对文档图像的多语种翻译工作 | 🌟🌟 | P0 | @kaori-seasons |
| 8 | 基于版面解析的PDF转word能力建设 | 特色能力 | 基于PaddleX版面解析V3(PP-StructureV3)产线,支持将PDF转换为word | 🌟🌟🌟 | P1 | |
| 9 | 基于版面解析的PDF转LaTex能力建设 | 特色能力 | 基于PaddleX版面解析V3(PP-StructureV3)产线,支持将PDF转换为LaTeX代码 | 🌟🌟🌟 | P1 |
PaddleX部署能力
mentor @zhang-prog 10 @Bobholamovic 11、12
| 序号 | 任务名称 | 任务类型 | 任务描述 | 难度 | 优先级 | 认领人/状态/PR号 |
|---|---|---|---|---|---|---|
| 10 | 服务多语言调用示例完善 | 文档建设 | 补全产线使用教程中的C++、Java、Go等6种语言的服务调用示例。 | 🌟 | P1 | |
| 11 | 服务性能指标补充 | 文档建设 | 1. 测量服务的QPS、峰值内存占用、CPU利用率、GPU利用率等性能指标。包括两种服务化部署方案。 2. 将服务性能指标、最低硬件配置等信息补充到文档中。 | 🌟 | P1 | |
| 12 | 预训练模型下载功能建设 | 辅助功能 | 为PaddleX增加模型下载功能,支持将模块或产线使用的官方模型下载到指定位置。 | 🌟 | P1 |
PaddleX创意应用
mentor @Sunting78 13 @liu-jiaxuan 14 @Bobholamovic 15
| 序号 | 任务名称 | 任务类型 | 任务描述 | 难度 | 优先级 | 认领人/状态/PR号 |
|---|---|---|---|---|---|---|
| 13 | 文档理解/总结/智能问答 | 创意应用 | 结合PaddleX现有OCR、PDF转Markdown、视觉、语音识别等能力,和文心大模、DeepSeek等大模型做深度结合,打造有创意的应用,如解题助手、文档总结、文档转脑图等 | 🌟 | P1 | |
| 14 | 漫画册/带文字图像智能翻译 | 创意应用 | 结合PaddleX 通用OCR能力、版面解析能力,结合inpainting模型和大语言模型,实现对带文字图像、漫画等的端到端文字翻译能力 | 🌟🌟 | P2 | |
| 15 | 图像智能解译 | 创意应用 | 结合PaddleX 视觉类模型、多模态模型、大语言模型,实现垂类场景图像的高精度智能解译能力 | 🌟 | P2 |
PaddleX算法探索
mentor @liu-jiaxuan 16
| 序号 | 任务名称 | 任务类型 | 任务描述 | 难度 | 优先级 | 认领人/状态/PR号 |
|---|---|---|---|---|---|---|
| 16 | 自然场景下无线表格框线补全算法 | 算法探索 | 结合 PaddleX 视觉类模型、OCR模型,实现对带倾斜、扭曲等干扰的自然场景下无线表格图像进行框线补全与表格识别 | 🌟🌟🌟 | P1 |
看板信息
| 任务方向 | 任务数量 | 提交作品 / 任务认领 | 提交率 | 完成 | 完成率 |
|---|---|---|---|---|---|
| PaddleX 快乐开源活动 | 16 | 1 / 3 | 6.25% | 1 | 6.25% |
统计信息
排名不分先后 @Echo-Nie (1)
【报名】:1
【报名】5、7