cyokel
cyokel
> 未配准数据集的红外图像和可见光图像相比,会存在横向拉伸,并且红外图像的画面范围比可见光图像小。我不了解您说的“未配准下的多光谱行人检测”这一任务,所以不太清楚这种不对齐是否能应用于您说的这个研究。或许您可以分享一下这个任务的链接或相关综述性的文章? 比如“Weakly Aligned Cross-Model Learning for Mulitispectral Pedestrian Detection”(ICCV2019)所进行的多光谱图像弱对齐下的目标检测
> 看起来LLVIP的raw_data对齐程度无法满足这个任务的要求,不过你可以尝试在raw_data的基础上进行粗略的配准,比如使用matlab的[cpselect](https://ww2.mathworks.cn/help/images/ref/cpselect.html),在手动选点时可以适当粗略一些,应该能达到你想要的效果。相同场景可以共享一个变换矩阵,无需对每一张图像都进行一次配准。 好的,感谢您的指点,我试试整理一下raw_data。
我试了直接用带白边的的图片训练,效果极其差。
> > > 我试了直接用带白边的的图片训练,效果极其差。 > > 请问你能训练出结果么,我用0.001的学习率训练 Retina net。bbox loss一直nan 结果不能用,,,出现nan的话调小学习率试试