TMANet icon indicating copy to clipboard operation
TMANet copied to clipboard

如何在自己的离散图片数据上训练

Open CabbageWust opened this issue 10 months ago • 2 comments

您好,感谢您的开源工作! 想请教您一下,我的训练数据是一张张汽车图像,每一组图都是以不同角度围绕着汽车拍摄的36张图像及其mask(0~360度,每10度拍摄一张),每组图有较强的一致性,我之前尝试了一些图像分割算法,目前效果较难提升了,想尝试下使用视频分割的思路,请问我应该怎样准备我的训练数据?我看了camvid的数据组织结构,images和labels中的图像是间隔了30帧,而image_sequence中是连续帧,不知道在训练过程中是怎样处理数据的。由于我之前没有接触过mmsegmentation这个框架,代码阅读起来有点困难。 期待您的回复!

CabbageWust avatar Jan 24 '25 07:01 CabbageWust

可以理解为我的图像数据是一套套围绕汽车拍摄一圈的视频按某个固定间隔抽帧后的图像,没有‘连续帧’的数据,image_sequence目录中我应该怎样准备图像呢。

CabbageWust avatar Jan 24 '25 08:01 CabbageWust

@CabbageWust Hi, 这里的连续帧通用意义上,不仅是针对视频而言的,可以表示为有关系的一系列图片。在视频中,这里的关系是时序关系,可能在您的应用中,这里是角度位置关系。用注意力关系的方式应该也可以建立这样的关系,您可以实验一下看看效果。数据构建的话,可以按照确定的关系进行构建即可,比如按照您描述的 顺时针方向每10度一张图像的方式排列(或者其他方式,保证每组照片的顺序一致),那么这里的角度关系就和时序关系对应起来了。

wanghao9610 avatar Feb 03 '25 12:02 wanghao9610