Paddle [XPU] Add rms_norm and rms_norm

PR Category

Custom Device

PR Types

New features

Description

添加XPU rms_norm和rms_norm_grad融合算子，与GPU保持一致

Apr 29 '24 12:04 cqulilujia

你的PR提交成功，感谢你对开源项目的贡献! 请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。 Your PR has been submitted. Thanks for your contribution! Please wait for the result of CI firstly. See Paddle CI Manual for details.

Apr 29 '24 12:04 paddle-bot[bot]

Sorry to inform you that 8aade47's CIs have passed for more than 7 days. To prevent PR conflicts, you need to re-run all CIs manually.

May 08 '24 03:05 paddle-ci-bot[bot]

Sorry to inform you that d7554df's CIs have passed for more than 7 days. To prevent PR conflicts, you need to re-run all CIs manually.

May 23 '24 03:05 paddle-ci-bot[bot]

从外部使用者的角度来看，新增算子绑定，和现有的走fast_paddle，有啥区别吗？

一方面，这个算子是PaddleNLP中的算子，GPU角度看，这个算子在PaddleNLP中已经被移到legacy文件夹，由PaddleNLP迁向paddle是一个趋势；另一方面，从XPU角度，fast paddle的地位需要逐渐弱化，让用户尽量不修改GPU代码就能使用，能迁移的尽量迁移，对外部使用者来说使用Paddle中的算子更为友好

Aug 29 '24 06:08 cqulilujia

从外部使用者的角度来看，新增算子绑定，和现有的走fast_paddle，有啥区别吗？

一方面，这个算子是PaddleNLP中的算子，GPU角度看，这个算子在PaddleNLP中已经被移到legacy文件夹，由PaddleNLP迁向paddle是一个趋势；另一方面，从XPU角度，fast paddle的地位需要逐渐弱化，让用户尽量不修改GPU代码就能使用，能迁移的尽量迁移，对外部使用者来说使用Paddle中的算子更为友好

PaddleNLP模型侧的代码修改可以参考 https://github.com/PaddlePaddle/PaddleNLP/pull/8746

Aug 29 '24 07:08 cqulilujia

LGTM

Aug 29 '24 07:08 skywalker2012

[XPU] Add rms_norm and rms_norm_grad op

PR Category

PR Types

Description