peyer

Results 23 comments of peyer

@Maosquerade 你好,请问你知道/WHOLEARCHIVE:TNN怎么在CMakeLists.txt里面生效吗?

@xyoungli I changed the value of parameter according your advice, but I still got different result compared with cudnn, could you take some time to check my calling code, I...

@yunfanxiao 我也是在小米11上,测试了高通官方最新的adreno_opencl_ml_sdk_v2.1.zip,小米11上调用clQueryMLInterfaceVersionsQCOM接口会返回CL_OUT_OF_HOST_MEMORY的报错,但是高通官方说660以上是支持cl_qcom_ml_ops扩展的,请教一下bolt是怎么测试出adreno_opencl_ml_sdk的性能的

嗷嗷,我也是看到知乎上bolt的一个大佬提及qcom的adreno_opencl_ml_sdk实测性能可以达到1.5T,所以想请教怎么解决 ![image](https://user-images.githubusercontent.com/19945545/151691289-09a2698c-a0d3-4886-8a23-5858d2ac34ca.png)

@chillingche 多谢,得找个root的设备试试;权限问题的话是手机厂商没有开放是吧,虽然高通开放了

上面的表述有误,我更正一下;应该是depth2space前一层是conv,conv的output是image类型并给了depth2space做输入,而depth2space的输入支持buffer的类型

python脚本构造一个简易网络,第一层是conv,输入1x2x4x4,filter16x2x3x3,stride=1,pad=0,dilation=1,输出1x16x2x2,第二层是depth2space,blocksize=4,输出1x1x8x8,也会触发

2分支都可能触发错误;因为depth2space的kernel输入只支持buffer的类型,一旦前一层传递一个image的就会出错

@yunfanxiao 还是有点问题,需要再改一下 ![image](https://user-images.githubusercontent.com/19945545/152757207-2e3313e7-040a-4b9e-8575-e69b28ec0d95.png)

按理说github的单元测试应该很容易找到这个bug,是CI没有跑就强合了吗?