Bhchen
Bhchen
@weveng 涨幅需要和你的supervise baseline结合来看 你的super应该是30mAP 大概是训了多少epoch呢以及step分别是多少呢
@weveng 那感觉不正常 我再coco的full data protocol下 第一个epoch可以到27  至少你这个5.8的相比30mAP还是感觉不太正常的
@weveng 对的 epoch=1时候的测试结果
@weveng 感觉差距这么大应该问题不在算法上面,可能是哪里的操作处理的不太对哈 盲猜。 (1)确定下参数是否真的加载正确了,其实用rla还是传统的resnet50 只是差1-2个点而已,这么大的结果差距应该不是方式的选择问题导致的。 (2)第二是尝试把 https://github.com/chenbinghui1/DSL/blob/45ee8fd1bc267f8d9fb1763d4979d7b0a9efc989/configs/fcos_semi/RLA_r50_caffe_mslonger_tricks_0.Xdata_unlabel_dynamic_lw_nofuse_iterlabel_si-soft_singlestage.py#L35 这个loss_weight改成1试一下,因为不太知道你的loss_cls变化的情况。 (3)第三就是确定下数据集的初始无标注伪标签是否合理?DSL-style数据的类别信息和Cocodataset类型的是否相同?因为我看你有200类,所以Cocodataset的代码应该也手动改过吧 尤其是里面的  类别顺序是否和DSL-style生成的category_info 里面的顺序一样
参看readme 里面的Tesing 不用改workflow 这只是config,相关脚本会自动读取需要的字段,把test字段里面的改成你要测试的数据,就行
@weveng 嗯看着没问题 比较正常,
@weveng 这肯定不是的,而且不应该有这个报错的 可以看下fcos_head.py的代码,是有keyword的 https://github.com/chenbinghui1/DSL/blob/45ee8fd1bc267f8d9fb1763d4979d7b0a9efc989/mmdet/models/dense_heads/fcos_head.py#L58-L71
@1icas tools/semi_dist_test.sh 调用config,使用里面的data.test字段里面的信息;所以你需要将你自己的图片整理成coco标准格式或者voc标准格式 或者DSL格式,然后修改对应的dataset_type和地址信息即可 https://github.com/chenbinghui1/DSL/blob/45ee8fd1bc267f8d9fb1763d4979d7b0a9efc989/configs/fcos_semi/r50_caffe_mslonger_tricks_0.Xdata.py#L113-L117 我们提供的tools/semi_dist_test.sh 是建立在mmdet基础上的 所以支持mmdet支持的格式 同时如果有DSL格式的 也同样支持
@1icas 很好的建议,这几天我会抽空弄一下
address already in use 的问题,解决方案: 【1】先nvidia-smi -l 看一下 把其他的全部程序关掉,再跑就可以;有时候前面出错的代码停掉后进程并没有关掉,显存并没有释放; 【2】基于【1】把脚本里面的port改一下 随便改一下 https://github.com/chenbinghui1/DSL/blob/4c2e6f3c5ffcc18ed874061f054da9779a2f736d/demo/model_train/baseline_coco.sh#L14 注:就是port用掉了 ,注意事项就是代码 不能同时运行再一个port上,改下port以及注意把没有关掉的程序关掉