nimda-z

Results 2 issues of nimda-z

硬件平台:Adreno(TM) 640,后端:OpenCL,开启MNN_GPU_MEMORY_BUFFER,执行createSession出现段错误。 通过加打印定位到段错误函数: source/backend/opencl/core/runtime/OpenCLRuntime.cpp : buildKernelWithCache。 以下是在buildKernelWithCache函数中加的打印信息: programName:conv_2d_buf, kernelName:conv_2d_c4h1w1 buildOptionsStr: -DFLOAT=half -DFLOAT2=half2 -DFLOAT3=half3 -DFLOAT4=half4 -DFLOAT8=half8 -DFLOAT16=half16 -DCOMPUTE_FLOAT=half -DCOMPUTE_FLOAT2=half2 -DCOMPUTE_FLOAT3=half3 -DCOMPUTE_FLOAT4=half4 -DCOMPUTE_FLOAT8=half8 -DCOMPUTE_FLOAT16=half16 -DCONVERT_COMPUTE_FLOAT=convert_half -DCONVERT_COMPUTE_FLOAT2=convert_half2 -DCONVERT_COMPUTE_FLOAT3=convert_half3 -DCONVERT_COMPUTE_FLOAT4=convert_half4 -DCONVERT_COMPUTE_FLOAT8=convert_half8 -DCONVERT_COMPUTE_FLOAT16=convert_half16 -DRI_F=read_imageh -DWI_F=write_imageh...

在高通8155平台,后端是opencl,循环只调用runSession和copyToHostTensor,发现会消耗很多cpu资源,请问如何定位具体是哪块消耗的?如何优化?谢谢! 这是统计的cpu资源消耗: ====== CPU Load Analysis ====== [MAX LOAD] Single Core: 30.70% Multi Core: 3.83% KDMIPS: 4.02 [AVG LOAD] Single Core: 26.10% Multi Core: 3.26% KDMIPS: 3.42 这是MNNV2Basic.out测试输出: precision:0, memory:...