godweiyang.github.io
godweiyang.github.io copied to clipboard
熬了几个通宵,我写了份CUDA新手入门代码 | 韦阳的博客
https://godweiyang.com/2021/03/28/nn-cuda-example/
在用PyTorch或者TensorFlow搭积木的时候,你是不是也遇到过下面这些情况:
自带的算子及其组合都无法满足你超(bian)常(tai)的计算需求。 自带的算子不可导,需要自己定义反向传播的梯度,例如argmax。 自带的算子太慢