yunfanxiao

Results 6 comments of yunfanxiao

可尝试使用taskset绑定测试程序到CPU大核调度,对小模型CPU调度和驱动开销无法被GPU kernel耗时掩盖,影响会比较明显

bolt目前没有集成qcom的ml sdk,这个问题可以去qcom官方问下

感谢您的反馈,确实会存在上述问题,可以尝试删除common/uni/include/algorithm_map.h 377行的if (targetMap.size() > 0)判断

你好,正常情况下depth2space的output不会被设置为image类型,可在cnn.cpp与memory_tracker的相关代码中定位为何被修改为image,可打开debug模式获取更多信息。

这里确实有些问题,请问计算触发[depth2space_mali_fp16.cpp](https://github.com/huawei-noah/bolt/blob/master/compute/tensor/src/gpu/mali/fp16/depth2space_mali_fp16.cpp) 74行的转换了吗?

提交了一个修复的patch,可以试一试https://github.com/huawei-noah/bolt/pull/92