PaddleClas
PaddleClas copied to clipboard
多标签图像分类模型:标注必须是one-hot encoding 标注吗?
请问下多标签图像分类的标签标注必须是one-hot encoding的形式吗?比如说PULC的车辆属性识别模型和人体属性模型的样例,我看都是one-hot的形式,比如车辆属性的标注:
image_train/0001_c001_00016450_0.jpg 1,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0
可以换种形式标注吗?比如我的标签如下所示:
0 绿色
1 红色
2 黄色
3 橙色
4 轿车
5 面包车
然后我的标注如下,也不一定是相同标签的,有的有2个标签,有的有3个标签,比如:
train/000001.jpg 0,4
train/000002.jpg 1,5
train/000003.jpg 2,3,4
标注成这样的形式,进行训练可以吗??
不可以,这种标注格式需要转换成n-hot的形式
不可以,这种标注格式需要转换成n-hot的形式
好的,谢谢
我对这个多标签分类的数据集也有疑惑,
https://blog.csdn.net/zhw864680355/article/details/96132042
https://blog.csdn.net/relocy/article/details/52174198
如以上这两篇文章一样,他们并没有使用one-hot 格式 而且直接使用标签索引,这样是否能够直接使用paddleclas直接训练呢?