PaddleClas
PaddleClas copied to clipboard
个体识别训练问题
- PaddleClas版本以及PaddlePaddle版本:PaddleClas release/2.2和PaddlePaddle 2.1.0
- 训练环境信息: a. 操作系统,如Windows b. Python版本号,如Python3.7.10 c. CUDA/cuDNN版本, 如CUDA11.2/cuDNN 8.1.1
我需要识别同一种鱼的不同个体,其中训练数据如下图所示,采用的车辆Reid配置文件,未对图像处理以及loss进行修改,只是修改了文件路径,其中训练集与测试集的划分按照图像检索任务进行划分,我一共有637个类,将前242类作为训练集,后395类作为测试集,训练可以正常进行,针对自己数据训练目标检测模型鱼特征提取模型后构建的图像识别系统在5条鱼的个体上进行测试,结果全部正确,然而将测试个体增加到50个,正确率却只有三分之一。
针对上述测试个体数增加,正确率降低的问题,我想请问一下原因在哪里?
我划分训练集与测试集的方法是否存在问题?对每一条个体按照一定比例划分训练集与测试集效果会更好?
针对我这样的数据集,使用车辆Reid的配置文件是否正确,是否应该换用其他的配置文件?或者对loss做一定的修改?
初步判断是训练集有点小。想问下 测试个体 是指库里的鱼的种类吗?还是指每种与的图片数量呢?
构建索引库的鱼的类别数,训练特征提取模型的鱼有637类,然后识别时从中选了5类构建索引库,然后在这五个个体的另一段未训练过的视频上测试,识别结果全部正确,然后从训练个体中选了50个类构建索引库,同样的在这50条个体的另一段视频上测试,正确率低很多,不到50%。
这个不太应该,方便的话可以具体看看数据吗?
怎么发给你呢
正确率低的这些样本人眼看上去怎么样呢?
人眼很难分辨,因为是同一种鱼得不同个体,类间相似度很高,训练出的模型在5条个体上全部识别正确,但是在50条个体上(包含前面的5条个体)识别率就大大降低,甚至5条时识别正确的用50条测试时会识别错误。
我现在用的是 ResNet50_ReID.yaml 的配置文件,预训练模型是 ResNet50_pretrained,如果预训练模型用下面的推荐的会比较好吗
