Xinpeng Dou

Results 4 comments of Xinpeng Dou

> 还有CUDA Graph这种计算图的优化,因为使用了python,不使用计算图优化会导致python成为性能瓶颈 昇腾NPU 配套的CANN支持计算图优化

> 还有CUDA Graph这种计算图的优化,因为使用了python,不使用计算图优化会导致python成为性能瓶颈 目前来看,关键在于marlin算子的实现

> KTransformers是当前最火热的最低成本的Deepseek满血版推理方案。KunLun AI Space大模型加速引擎在此基础上完成两项重大技术突破:移植KTransformers到鲲鹏+昇腾全国产生态,同时使用自研算子替代Marlin算子,实现单张昇腾300I Duo推理卡高效运行满血版DeepSeek大模型 > > https://mp.weixin.qq.com/s/amGL613UMF-seH9pkzZI_g 目前有代码公布计划时间吗?