tensorRT_Pro icon indicating copy to clipboard operation
tensorRT_Pro copied to clipboard

cudaMemcpy耗时较大,对于大图来说,请问有优化方法吗?

Open MrWwei opened this issue 1 year ago • 1 comments

我使用的是yolo gpuptr版本,批量数据在添加到images_gpu时,host与device拷贝时间较长,大佬能否提供一下优化思路?

MrWwei avatar Apr 19 '23 03:04 MrWwei

你可以使用pinned memory,也就是cudaMallocHost来分配host的内存,可以优化比较明显

hopef avatar May 24 '23 05:05 hopef