www.ziwang.com comments

Repositories
Issues
Comments

Results 1 comments of


                                            www.ziwang.com

Would you like regularly release newly trained model checkpoint?

强烈建议发布，目前hf极度缺乏这种不同时间周期的连续训练模型，而这种模型和数据，是很多llm优化项目说需要的。在《zero-lora零训练llm调参算法》当中，其中的一个关注要点就是： [https://github.com/ziwang-com/zero-lora](https://github.com/ziwang-com/zero-lora) 基于时间（不同训练周期检查点）、空间（不同token权重对比）、深度（不同模型的tok权重映射）等多种维度的lora权重优化体系。