Yuqiang Ge

Results 5 issues of Yuqiang Ge

包含了Eigen,Stream和一些基础功能的添加。在沐曦maca上测试bincount_kernel成功。

### PR Category Environment Adaptation ### PR Types Others ### Description Enable AVX in Linux-CPU / Build

### PR Category Custom Device ### PR Types Improvements ### Description Remove hard-coded hardware in sdpa. These two apis can automatically select attention backends on Metax and Iluvatar.

## 背景 飞桨在3.1 版本推出了 **类 CUDA 硬件接入方案**。该方案在 [Custom Device硬件接入方案](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/dev_guides/custom_device_docs/custom_device_overview_cn.html) 的基础上进行了升级,最大的特点是可以 **复用飞桨 PHI 算子库中的大量 CUDA Kernel**。 当前此方案已经成功接入**沐曦(metax_gpu)**和**天数智芯(iluvatar_gpu)**。 然而,目前PHI 算子库中的部分 CUDA Kernel 并未考虑被其他模块复用的情况,导致出现以下问题: 部分 Kernel 缺少函数声明,类 CUDA 硬件在复用时不得不直接 `#include` **`.cu` 源文件**,这不符合代码规范。 因此,本次活动旨在对...

good first issue

## 背景 飞桨框架迭代较快,其部分单测没有跟框架同步更新,导致当前很多单测处于不可用状态。 ## 涉及范围 - 截止 2025-09-03 的 `develop` 分支, 排查后发现有 22 个在 GPU 上报错的算子单测 - 本期仅修复算子单测报错 ## 任务 表格中为单测名称,具体文件位于`Paddle/test/legacy_test/`目录下,文件名为`单测名称.py`。例如`test_activation_op`对应的单测文件是`Paddle/test/legacy_test/test_activation_op.py` | 序号 | 单测名称 | 认领人 / 状态 /...

good first issue