pytorch-YOLO-v1
pytorch-YOLO-v1 copied to clipboard
你的resnet50作为backbone时,输入(3,448,448)的图片,输出维度不是(7,7,30)!
S那里是不是就有问题
作者复现时进行了改进感觉是把特征图尺寸设置为14x14
的確,雖然作者在註解部分都寫 grid size 為 7x7x30,但實際上程式的寫法都是 14x14x30, 我想會這麼做應該是因為作者提高了輸入的尺寸(448x448),使得 resnet50 的輸出會變成 14x14x30。
最后边改了,用的是卷积层而不是全连接层
我说,看了半天,注释跟代码没对应上
Resnet原论文的输入是224224,对应输出77,因此448输出是14*14的feature map
准确地来说不是有问题,是这个代码是预训练代码,应该还要有一个微调部分,预训练输入是224,微调才是448