SuperYOLO icon indicating copy to clipboard operation
SuperYOLO copied to clipboard

SuperYOLO

Results 26 SuperYOLO issues
Sort by recently updated
recently updated
newest added

您好!您的代码我最近正在复现,有点疑问需要您解答一下,是关于分辨率的问题。 在对比实验中有“训练图像-测试图像”的分辨率设置,对于其中“**训练输入图像为1024*1024,测试图像为1024部分**”有些疑问,在train.py中train_img_size理所应当设置为1024,因为根据yaml配置文件,读取的fold01_write.txt指向VEDAI1024的路径,但fold01test_write.txt指向的测试集和验证集均来自低分辨率的VEDAI,我的疑问是: (1)在进行这样的训练时,是不是直接将test_img_size设置为1024就可以了呢,或者说需要在设置test_img_size的同时,将fold01test_write.txt指向的测试数据更改为VEDAI1024下的图片路径呢,但这样一来,对应的label文件不就需要改变吗? (2)我看训练集和测试集虽然都来自不同的分辨率,但是VEDAI1024和VEDAI下的labels的标注信息是一样的,既然分辨率不同,它们的标注不应该不一样吗,是不是在代码中有对应不同输入尺寸进行label标注缩放的处理呢? 以上是我的疑问,因为本人刚接触目标检测不久,对许多概念比较模糊,如有冒犯之处,烦请原谅。

您好,我用您的默认指令和代码复现过几次,在VEDAI数据集的fold1中,map50指标最高仅为0.78,远不及您论文中的80.9......请问您后续程序是有改进?还是有其他拓展指令?

您好,请问您文章中消融实验部分的超分输出的PNSR和SSIM值是用什么思路求得的

请问构造损失中的输入图像X具体是哪部分的输入,是最初的原始输入经过多模态融合后的,还是encoder的输入高低级特征

![Snipaste_2024-01-21_16-48-11](https://github.com/icey-zhang/SuperYOLO/assets/144891526/3f326220-94da-40c6-b88b-75e4bf948bac) 1.我的疑问是如果删除了medium和large对应的concat部分,只保留small特征图,这里不应该只有一个输出y吗? 2.对应的,我也有疑问,损失函数中的l(小L)不应该也是只有一层吗 ![Snipaste_2024-01-21_21-41-58](https://github.com/icey-zhang/SuperYOLO/assets/144891526/fa9e0eea-32b8-44fc-bb90-56fa2ab60b53) 所以我认为如果是在【多模态】输入的情况下,并且只保留small特征图的情况下,网络中只剩有FPN结构,并没有PANet结构。 但是在【单模态】输入下我提出的所有疑问都将解决,1.会有3个y。 2.也会有3层,并且结构依然是PANet。 我想请问您,我的观点是否正确,请您解答。

It seems like the line here would make a call to an uncaught exception in the current version of YoloV5 (this was fixed in a recent patch). The exception read:...

### Discussed in https://github.com/icey-zhang/SuperYOLO/discussions/117 Originally posted by **icey-zhang** June 9, 2024 > ## 👋 Welcome! > We’re using Discussions as a place to connect with other members of our community....

May I ask how you obtained the multimodal results on the comparison algorithm? What is the specific training configurations?

请问如果训练自己的数据集,需要将图像resize成1024*1024或512*512吗?相应的labels标签呢?

why SuperResolution module is a annotation in yaml ? I cannot find SuperResolution in commons and parse_module . The Detect module include the SuperResolution ?