xianyu

Results 20 issues of xianyu

model list: 1. deepseek 2. Gemma

enhancement

documentation
plan

documentation
plan

All OpenLLMAI docs and xianyu personal docs

documentation

目前我们正在启动V1版本的开发,整体的开发计划如下,主要包括了文档和代码两类任务,数据的部分我们暂时将其分散到了各个子任务中。 V1版本:资料调研+通用最小实现+领域/任务适配 1.1 文档分支 文档分支主要负责项目文档的建设,包括通用技术文档和项目相关文档。 dev_for_docs:文档分支,主要负责资料调研(算力有限,有调查才有训练权): 【P0】开源ChatGPT调研:持续更新,doing 【P0】训练技术调研:持续更新,doing 【P0】数据调研:doing 【P1】部署技术调研:TODO 【P2】基础模型调研:目前以LLaMA和GLM为主,doing 【P3】技术解读/教程:doing 1.2 代码分支 代码分支,负责具体的开发工作,包括数据处理、算法开发、算法评测等,分成通用最小实现和领域/任务适应两种,具体的: dev_for_chatmini:通用最小实现分支,尽可能支持不同的基础模型和训练方式,提供可比较的实现。 【P0】ChatGPT最小复现:完整的RLHF复现SFT-RM-PPO,doing 【P0】适配不同的基座模型 适配不同的PEFT算法 【P2】探索新的训练方式 【P3】探索知识迁移:比如蒸馏 dev_for_chatzhihu:知乎及问答领域适配,主要想解决一些知乎使用过程中的痛点,比如问题冗余、回答太多等等。 【P0】收集知乎数据收集及处理 SFT数据 RLHF数据:答案打分 摘要数据:答案/观点汇总、摘要 【P0】基于知乎数据做SFT 【P1】基于知乎数据做RLHF 【P2】输出知乎LoRA 【P3】和知乎热榜聊天的demo...