CUDA-Learn-Notes 您好，请教一个关于代码中reduce相关的问题

您好，请教一个关于代码中reduce相关的问题

Open Ss-shuang123 opened this issue 9 months ago • 3 comments

sum = warp_reduce_sum<NUM_WARPS>(sum);
if(warp==0) sum = warp_reduce_sum<NUM_WARPS>(sum);

0x03 warp/block reduce sum/max 、0x09 softmax, softmax + vec4 做final sum的时候，用的是第一种形式 0x04 block all reduce + vec4 而用的是第二种形式我的理解是，最后final sum的时候是不是应该用第二种形式？最后都集中在第一个warp束中。感谢！

May 05 '24 11:05 Ss-shuang123

CUDA-Learn-Notes CUDA-Learn-Notes copied to clipboard

您好，请教一个关于代码中reduce相关的问题

CUDA-Learn-Notes
CUDA-Learn-Notes copied to clipboard