wly2020-robot
wly2020-robot
编译通过,谢谢。 ------------------ 原始邮件 ------------------ 发件人: "meiqua/shape_based_matching"
是fusion阶段的第一次耗时计算。
嗯,用placement new 替代buffer_0,buffer_1分配固定内存难以入手。
placement new平时用的少,介绍是说在已经分配的内存上创建对象。
嗯,非常感谢,期待。
融合进行了调试和测试,几乎没有多大变化,依然是第一次fusion time不稳定,有突变。
下面是融合你今天给到我代码的fusion time和match time情况:  下面是之前没改动代码的耗时情况: 
调试参数设置:const int tileRows = 32; const int tileCols = 256; const int num_threads_ = 4;
我在我的工作台式电脑上跑同样环境检测同种物料,耗时在50ms左右,比较稳定。电脑配置看下面截图:   有安装NVIDA CUDA运行库寄相关驱动和开发工具。而且添加了openmp对算法耗时起到了比较大作用,在台式电脑上跑出算法总耗时在50ms左右的效果,我认为NVIDA CUDA运行库起到了比较重要的作用。如果算法在TX2上跑,是不是算法耗时会比较稳定,而且耗时会比较少?
以下是在以上硬件配置上win10同等条件下跑出来的fusion time和match time,速度还是可以的; 