hack-SysML
hack-SysML copied to clipboard
The road to hack SysML and become an system expert
最好能分以下类,搞个一二三级标题,目前基本是平铺出来的。 比如 pruning,knowledge distillation等技术,可以放到一起
Solutions for tasks about CLIP
""" 改动说明: 修改https://huggingface.co/deepseek-ai/DeepSeek-V2/blob/main/modeling_deepseek.py的MoEGate类 补充: Device-Level Balance Loss 和 Communication Balance Loss 的计算 最终aux_loss为3者简单相加(代码:109-149行) 在config.json中添加了M alpha 1, 2, 3 都使用aux_loss_alpha """
您好,我是宋晗搏,是北京邮电大学人工智能学院的学生,希望能去您的团队实习,这是我关于您给我的那篇文章写的wiki,请您过目。
This is my answer submission.