Xinpeng Dou
Results
4
comments of
Xinpeng Dou
> 还有CUDA Graph这种计算图的优化,因为使用了python,不使用计算图优化会导致python成为性能瓶颈 昇腾NPU 配套的CANN支持计算图优化
> 还有CUDA Graph这种计算图的优化,因为使用了python,不使用计算图优化会导致python成为性能瓶颈 目前来看,关键在于marlin算子的实现
> KTransformers是当前最火热的最低成本的Deepseek满血版推理方案。KunLun AI Space大模型加速引擎在此基础上完成两项重大技术突破:移植KTransformers到鲲鹏+昇腾全国产生态,同时使用自研算子替代Marlin算子,实现单张昇腾300I Duo推理卡高效运行满血版DeepSeek大模型 > > https://mp.weixin.qq.com/s/amGL613UMF-seH9pkzZI_g 目前有代码公布计划时间吗?