hooponn

Results 3 comments of hooponn

> 你在统计时间的时候有同步吗,可以调用outputs->readMap() 谢谢回答。 时间统计应该没问题。 后来我尝试了每次推理之前都重新load一下模型,这样速度就没问题。但是load的时间很长,总的时间算起来比之前更长了。 然后又发现两个模型的缓存文件是一模一样的,对比过二进制都是一致。 难道要两个进程隔离执行?后续我再试试。

试了不同进程下的效果。 两次foword时间都正常了。 但是第一次的结果readMap取出来或者save保存到本地文件时间都用了600ms左右。 整体时间还是没变,此消彼长,总有个地方会耗时。

> opencl是异步执行的,在调用readMap时才会同步,所以forward的时间不准确。 你可以编译的时候打开宏 MNN_OPENCL_PROFILE,开启后会打印OpenCL执行kernel的总耗时,这个时间一般是和总耗时一致的。 非常感谢!你这么一说就解释得通了,原来如此。前面我理解错了,还得好好学习。