minimind
minimind copied to clipboard
想问一下作者大大是怎么做到模型大小这么小的,通过模型压缩或是参数共享吗,还是只是减少了layer、dim这些参数呢?
最近有在看MobileLLM那篇论文,不知道作者是不是用了论文里面的技术呢?如embedding share、GQA等呢