Chunzhang Liu
Results
2
comments of
Chunzhang Liu
嗯,衷心希望后面内容及时更新。最近我参考你的书上机学习,经常出现我发现某某特性已被废弃的情况(比如直接调用nvprof检查程序已不再被支持),只好临时再查找很多功能的上位替代。CUDA技术实在是变得太快了,希望你能在以后改版的preface里着重强调这一点。最后,我尝试加你的QQ群两次了,都没过,能不能过一下,我的QQ是3089376218,希望以后能经常交流。
是编译运行后的结果。我用的操作系统为Ubuntu 22.04 LTS,显卡为GeForce RTX 4090(计算能力8.9),当前CUDA版本12.5。 之后我又做了些测试,结果可以简单概括为拷贝实际方向只和cudaMemcpy的前两个参数有关系,和第四个参数cudaMemcpyKind的具体取值无关。 现在我推测,应该是在Linux系统下,采用了CUDA 6.x及之后版本统一内存特性(windows OS下,即使计算能力达到了6.x及更高,也强制限制为6.x以下,只能使用基本的统一内存特性)后,设备不区分显存和内存(自然,CPU部内存和GPU部显存也没必要分清楚,那么H2D还是D2H都没啥区分意义),cudaMemcpy指定第四个参数就没用了(此时个人觉得一律默认default就好)。