Dive-into-DL-PyTorch icon indicating copy to clipboard operation
Dive-into-DL-PyTorch copied to clipboard

关于第九章目标检测的三个函数实现

Open aker218 opened this issue 4 years ago • 0 comments

你好,我按照李沐原书里的代码实现了9.6节SSD的神经网络来进行目标检测,在其中需要用到MultiBoxPrior、MultiBoxTarget、MultiBoxDetection这三个作者实现的函数。但是似乎MultiBoxDetection的实现有一点问题。 书中我看到MultiBoxTarget在输入锚框和真实目标框之后,会输出每个锚框根据其所在类别相较于真实框的位置偏移bbox_offset,在书中例子给出来的输出结果中,有些坐标的偏移达到了7.17、10这个数量级(李沐的原书里面也是这样),然后我看到作者在后续的MultiBoxDetection实现上好像直接把这个偏移加到了锚框坐标上?这样的话加上很大数量级的偏移得到的锚框位置甚至会跑出图像,所以我是用以上三个函数及我训练的神经网络进行目标预测得到的目标框有很多会飘出图像内,可能是MXNET的实现中做了一些调整?

aker218 avatar Mar 03 '20 09:03 aker218