MTCNN-Tensorflow icon indicating copy to clipboard operation
MTCNN-Tensorflow copied to clipboard

generate_bbox(self, cls_map, reg, scale, threshold)函数是什么意思

Open piaopiaodedudou opened this issue 7 years ago • 2 comments

generate_bbox(self, cls_map, reg, scale, threshold):函数返回的是检测框的坐标和评分吗? boundingbox = np.vstack([np.round((stride * t_index[1]) / scale), np.round((stride * t_index[0]) / scale), np.round((stride * t_index[1] + cellsize) / scale), np.round((stride * t_index[0] + cellsize) / scale), score, reg]) 有没有大神能解释下vstack里边的部分都是什么意思,尤其是stride那部分?

piaopiaodedudou avatar Sep 04 '18 08:09 piaopiaodedudou

原来PNet网络结构存在着stride=2,kernel size=2的pooling层,所以W * H的数据,经过PNet这一层的时候,会变为W/2 * H/2,那这层输出和输入的左上角点坐标对应关系就是 before_index = stride * after_index,右下角点坐标对应关系为: before_index = stride * after_index + kernel-size。 而卷积层由于没有stride,所以不用乘系数。但卷积会影响感受野,综合卷积层和pool得到的PNet网络,可以看成是感受野12 * 12的FCN,所以右下角最终为 before_index = stride * after_index + cellsize。 实在不清楚对应关系,这个这么小的网络,你画个图,也就清楚了

zheng-yuwei avatar Apr 12 '19 07:04 zheng-yuwei

为什么 x1=stride * t_index[1]) / scale 而不是 x1=stride * t_index[0]) / scale? 这坐标是不是搞反了呀?

zhgyong avatar Jun 27 '19 02:06 zhgyong