jobs
jobs copied to clipboard
[校招/社招][潞晨科技]研发-超大模型训练研究员
职位描述
1、深入研究超大规模神经网络在海量数据上的训练精度问题,实现超大规模神经网络的高精度训练; 2、利用预训练大模型,突破各类任务的精度瓶颈(包括NLP及计算机视觉等,NLP优先); 3、负责超大规模神经网络训练技术在公司实际业务场景中的落地使用; 4、负责研发通用模型,探索使用高精度Teacher进行知识蒸馏。
职位要求
1、有比较扎实的计算机理论基础,熟练使用Python/C++编程; 2、有深度学习等算法基础,熟悉深度学习中的常见问题与算法,了解模型训练的原理,熟悉任一深度学习框架;
加分项
- 熟悉模型训练原理和Optimizer基本原理,了解分布式训练基本方法,对混合精度训练、数据并行等训练加速方法有所了解优先;
- 有开源项目经验或者有较强的研究能力,于ICML、NIPS、AAAI、CVPR等CCF-B以上AI会议或期刊上发表过文章优先。
(可选)岗位亮点
潞晨科技是一家分布式高性能计算领域的创业公司,旨在打造一个高效率低能耗的分布式人工智能系统,帮助企业最大化人工智能部署效率的同时最小化人工智能的部署成本,目前公司已获得包括创新工场、真格基金等多家机构天使轮投资。公司目前已在GitHub上开源大规模训练系统Colossal-AI,目标成为业界最有影响力的AI系统软件的开源社区。
潞晨科技的团队分布在新加坡和北京,团队成员来自于斯坦福、清华、北大、浙大、新加坡国立等顶级名校。核心团队具备丰富互联网大厂从业经验,多位员工曾在PPoPP,SC,IPDPS,NuerIPS,ICLR等会议上发表第一作者论文,可以为员工提供充分的工程和科研指导。公司具备充足的GPU资源,为每一位员工的创新想法提供算力支持。潞晨科技致力于打造开放共享的开源社区,让你的每一行代码都可以让全世界看到。
潞晨科技创始人尤洋博士毕业于UC Berkerly,目前是新加坡国立大学计算机系校长青年教授,LAMB优化器提出者,曾创造ImageNet以及BERT训练速度的世界纪录,他获得过IPDPS,ICPP的最佳论文,福布斯30岁以下精英。
潞晨科技工作以结果为驱动,采用硅谷办公方式,强调工作生活平衡,支持灵活的办公时间。公司提供水果、零食、餐补等多项福利。
联系方式
工作地点:北京、新加坡 简历投递邮箱:[email protected]