PaddleClas
PaddleClas copied to clipboard
PP—ShiTuV2 RPC训练数据问题确认
1,数据集中的数据量,是图片数,还是分类数?
2,PRC的数据,官方给出的是200分类,训练集数据近6万。与PaddleClas给出数据不符。
请帮忙确认图片中,RPC 3K,是什么意思。如果我们只用RPC数据做迁移学习,训练数据集应如何调整?
3,我们目前用RPC全量数据做迁移学习,loss停留在0.4无法收敛,请给出优化建议。
配置如下:
BASE: [
'../../../runtime.yml',
'../../base/picodet_esnet.yml',
'../../base/optimizer_100e.yml',
'../../base/picodet_640_reader.yml',
]
pretrain_weights: https://paddledet.bj.bcebos.com/models/picodet_lcnet_x2_5_640_mainbody.pdparams weights: output/picodet_lcnet_x2_5_640_mainbody/model_final find_unused_parameters: True use_ema: true cycle_epoch: 10 snapshot_epoch: 1
PicoDet: backbone: LCNet neck: CSPPAN head: PicoHead
LCNet: scale: 2.5 feature_maps: [3, 4, 5]
metric: COCO num_classes: 1
LearningRate: base_lr: 0.0005 schedulers:
- !CosineDecay max_epochs: 100
- !LinearWarmup start_factor: 1 steps: 1
TrainDataset: !COCODataSet #image_dir: ./ image_dir: train2019/ anno_path: instances_train2019_main.json dataset_dir: dataset/dataset_rpc/ data_fields: ['image', 'gt_bbox', 'gt_class', 'is_crowd']
EvalDataset: !COCODataSet image_dir: val2019/ anno_path: instances_val2019_main.json dataset_dir: dataset/dataset_rpc/ data_fields: ['image', 'gt_bbox', 'gt_class', 'is_crowd']
TestDataset: !ImageFolder anno_path: ./dataset/dataset_rpc/instances_test2019_main.json