宁鹏涛

Results 12 issues of 宁鹏涛

我的需求是希望能够做专用的小模型(纯个人使用),但小模型需要具备基本的逻辑能力,并且个人没太多资源,顶多两张4090。 所以,我想通过看看是否能够通过蒸馏的方法解决这个需求。 这是一篇将transformers架构通过蒸馏的方法转换为ssm [Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models](http://arxiv.org/abs/2408.10189)

enhancement

要不集成一下试试? https://github.com/MoonshotAI/Moonlight