pytorch-YOLO-v1 icon indicating copy to clipboard operation
pytorch-YOLO-v1 copied to clipboard

你的resnet50作为backbone时,输入(3,448,448)的图片,输出维度不是(7,7,30)!

Open 07hyx06 opened this issue 5 years ago • 7 comments

07hyx06 avatar Sep 27 '19 13:09 07hyx06

S那里是不是就有问题

2017TJM avatar Oct 22 '19 13:10 2017TJM

作者复现时进行了改进感觉是把特征图尺寸设置为14x14

2017TJM avatar Oct 22 '19 13:10 2017TJM

的確,雖然作者在註解部分都寫 grid size 為 7x7x30,但實際上程式的寫法都是 14x14x30, 我想會這麼做應該是因為作者提高了輸入的尺寸(448x448),使得 resnet50 的輸出會變成 14x14x30。

rox38431 avatar May 11 '20 03:05 rox38431

最后边改了,用的是卷积层而不是全连接层

freemedom avatar May 16 '22 08:05 freemedom

我说,看了半天,注释跟代码没对应上

Vandaci avatar Jul 20 '22 00:07 Vandaci

Resnet原论文的输入是224224,对应输出77,因此448输出是14*14的feature map

yitianad avatar Feb 15 '23 12:02 yitianad

准确地来说不是有问题,是这个代码是预训练代码,应该还要有一个微调部分,预训练输入是224,微调才是448

ZXTFINAL avatar Jan 23 '24 01:01 ZXTFINAL