配音员

Results 8 comments of 配音员

> 一个简单的解决办法就是:在eval的时候,传给log_validatation的net,做一个深拷贝就好了,避免覆盖训练的net 把 > > ``` > reference_unet = ori_net.reference_unet > denoising_unet = ori_net.denoising_unet > ``` > > 改成 > > ``` > reference_unet = copy.deepcopy(ori_net.reference_unet) > denoising_unet = copy.deepcopy(ori_net.denoising_unet)...

why not use body_18 model directly?

您好,首先十分感谢解答。我使用的数据集是food-recognition-2022 ,且以coco格式标注。数据集的文件目录按照您readme中的说明创建。使用了两张3060显卡训练。img_meta 我理解的是mmdet自动创建的,用来管理图像相关的元信息。 但是在representation阶段的训练没有问题。我发现第一个epoch训练结束后,评估evaluate bbox时代码中断并报该错误。但是我不知道如何修改。您能帮我分析下吗?

感谢!根据您的建议,已训练完毕。模型在food recognition 2022 /kaggle 数据集上的性能指标: Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.026 Average Precision (AP) @[ IoU=0.50 | area= all | maxDets=1000 ] =...

第一阶段测试结果: 2023-10-12 04:49:57,901 - mmdet - INFO - Epoch(val) [12][2499] bbox_mAP: 0.0230, bbox_mAP_50: 0.0670, bbox_mAP_75: 0.0090, bbox_mAP_s: 0.0000, bbox_mAP_m: 0.0120, bbox_mAP_l: 0.0240, bbox_mAP_copypaste: 0.023 0.067 0.009 0.000 0.012 0.024 看起来似乎不太正常

作者 这种情况跟分布式训练有关吗 我用的单卡训练 没有改动您的代码中关于分布式的部分

感谢! dict( type='Resize', img_scale=[(1333, 640), (1333, 672), (1333, 704), (1333, 736), (1333, 768), (1333, 800)], multiscale_mode='value', keep_ratio=True), 我的错误是把这里的多尺度训练设太小了。。

FCBL 是否就是loss_cls : type == BCE ?