ArmNeonOptimization
ArmNeonOptimization copied to clipboard
关于boxFilter的测试
求问为啥后面的neon指令看上去并没有加速很多?这里面的原因是为啥?
其实加速收益很大部分来自于行列分离,就是 算法上的改进,。因为编译器也会自己用上一些向量化的指令,而且boxfiler也没有什么复杂的计算,所以再加上neon指令收益就不大了。