PaddleX icon indicating copy to clipboard operation
PaddleX copied to clipboard

PaddleX 快乐开源活动 (2025 H1)

Open cuicheng01 opened this issue 8 months ago • 2 comments
trafficstars

📣PaddleX 快乐开源活动

旨在鼓励更多的开发者参与到飞桨低代码开发工具的开源建设中,帮助社区修复 bug 或贡献 feature,共建飞桨。

🌈命题任务

命题任务是我们总结整理PaddleX的需求得出,每个任务上标注了任务难度,大家可以选择参与。欢迎对这些需求感兴趣的开发者参与到这些任务的开发✌️✌️。在开发过程中,你能进行包括任务分解、代码撰写等工作,还会有飞桨的研发全程和你一起解决可能遇到的问题。还等什么,快来参与吧。🎉🎉

认领方式

请大家以 comment 的形式认领任务,如:

【报名】:1、3、2-3
  • 多个任务之间需要使用中文顿号分隔,报名多个连续任务可用横线表示,如 1-2
  • PR 提交格式:在 PR 的标题中以 【PaddleX No.xxx】 开头,注明任务编号

任务列表

PaddleX基础能力

mentor @changdazhou @openvino-book 1 @TingquanGao 2 @leo-q8 3 @zhangyubo0722 4、6 @BluebirdStory 5

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
1 PaddleX文档优化 文档建设 1. 优化PaddleX现有的文档文字描述,优化站点文档;2.整理和优化PaddleX的FAQ模块;3.增加VisualDL等文档的描述 🌟 P0 @Echo-Nie #4064
2 PaddleX推理能力测试 训推能力建设 基于PaddleX现有的单模型和模型产线,在不少于10种不同软硬件平台测试推理的功能稳定性和正确性 🌟 P0
3 OCR类产线的web端demo展示搭建 前后端开发 搭建不少于5个重要OCR类产线的web端demo应用 🌟 P0
4 OCR类模型的量化训练适配 训推能力建设 跑通不少于5个重要的OCR类模型的模型量化能力,精度和FP32对齐 🌟🌟 P1
5 数据标注流程打通 训推能力建设 将LabelStudio等标注软件和PaddleX现有的数据要求完全打通,可以产出符合PaddleX格式的标注数据,并打通自动化标注流程(包括加载PaddleX产出的模型权重或者预标注文件) 🌟🌟 P1 @kaori-seasons
6 数据分析 训推能力建设 增强当前PaddleX的训练数据分析的分析能力,美化输出结果 🌟 P2

PaddleX特色能力

mentor @changdazhou 7 @TingquanGao 8、9

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
7 基于版面解析和大语言模型的文档翻译能力建设 特色能力 基于PaddleX版面解析V3(PP-StructureV3)产线,结合大语言模型,支持对文档图像的多语种翻译工作 🌟🌟 P0 @kaori-seasons
8 基于版面解析的PDF转word能力建设 特色能力 基于PaddleX版面解析V3(PP-StructureV3)产线,支持将PDF转换为word 🌟🌟🌟 P1
9 基于版面解析的PDF转LaTex能力建设 特色能力 基于PaddleX版面解析V3(PP-StructureV3)产线,支持将PDF转换为LaTeX代码 🌟🌟🌟 P1

PaddleX部署能力

mentor @zhang-prog 10 @Bobholamovic 11、12

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
10 服务多语言调用示例完善 文档建设 补全产线使用教程中的C++、Java、Go等6种语言的服务调用示例。 🌟 P1
11 服务性能指标补充 文档建设 1. 测量服务的QPS、峰值内存占用、CPU利用率、GPU利用率等性能指标。包括两种服务化部署方案。 2. 将服务性能指标、最低硬件配置等信息补充到文档中。 🌟 P1
12 预训练模型下载功能建设 辅助功能 为PaddleX增加模型下载功能,支持将模块或产线使用的官方模型下载到指定位置。 🌟 P1

PaddleX创意应用

mentor @Sunting78 13 @liu-jiaxuan 14 @Bobholamovic 15

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
13 文档理解/总结/智能问答 创意应用 结合PaddleX现有OCR、PDF转Markdown、视觉、语音识别等能力,和文心大模、DeepSeek等大模型做深度结合,打造有创意的应用,如解题助手、文档总结、文档转脑图等 🌟 P1
14 漫画册/带文字图像智能翻译 创意应用 结合PaddleX 通用OCR能力、版面解析能力,结合inpainting模型和大语言模型,实现对带文字图像、漫画等的端到端文字翻译能力 🌟🌟 P2
15 图像智能解译 创意应用 结合PaddleX 视觉类模型、多模态模型、大语言模型,实现垂类场景图像的高精度智能解译能力 🌟 P2

PaddleX算法探索

mentor @liu-jiaxuan 16

序号 任务名称 任务类型 任务描述 难度 优先级 认领人/状态/PR号
16 自然场景下无线表格框线补全算法 算法探索 结合 PaddleX 视觉类模型、OCR模型,实现对带倾斜、扭曲等干扰的自然场景下无线表格图像进行框线补全与表格识别 🌟🌟🌟 P1

看板信息

任务方向 任务数量 提交作品 / 任务认领 提交率 完成 完成率
PaddleX 快乐开源活动 16 1 / 3 6.25% 1 6.25%

统计信息

排名不分先后 @Echo-Nie (1)

cuicheng01 avatar Mar 07 '25 12:03 cuicheng01

【报名】:1

Echo-Nie avatar Mar 11 '25 12:03 Echo-Nie

【报名】5、7

kaori-seasons avatar Jun 05 '25 05:06 kaori-seasons