lixiyuan

Results 8 comments of lixiyuan

Thank you,I got it, but I generated pseudo labels using the ''cityscapes-fine'' model given in the model zoo according to step 5, and then according to step 6, I used...

I trained my model by running: ` ` ` python tools/train_net.py --num-gpus 1 --config-file ./configs/MGNet-KITTI-Eigen-Zhou.yaml MODEL.WEIGHTS checkpoint/model_cityscapes_fine.pth ` ` ` I compared the inference results of the model and the...

我也遇到了,请问你解决了吗

> 同样的问题,请问如何解决的 我发现当存在冻结网络的行为时,多卡训练就会卡死,没有冻结时就可以正常训练。看源码我猜测应该是把模型放到多张显卡上之后,冻结了部分网络,但是这个操作又没有同步到所有显卡上,所以卡死。我对多卡了解不多,也不确定原因对不对,你可以看看。

> > > 同样的问题,请问如何解决的 > > > > > > 我发现当存在冻结网络的行为时,多卡训练就会卡死,没有冻结时就可以正常训练。看源码我猜测应该是把模型放到多张显卡上之后,冻结了部分网络,但是这个操作又没有同步到所有显卡上,所以卡死。我对多卡了解不多,也不确定原因对不对,你可以看看。 > > 感谢回复,我现在就是重新训练,冻结seg分支,训练det分支 我最后还是用的单卡练的,应该是要先冻结模型然后再把模型包装成DDP模型也就是model = torch.nn.parallel.DistributedDataParallel(model, device_ids=[args.gpu]),你可以试试

如果你不用seg分支可以直接删掉,修改模型配置文件就可以

你好,你跑通了吗,我想测试只跑检测和分割的任务,改了default.py后运行报错,因为在autodirvedataset里有 ‘lane_label = cv2.resize(lane_label, (int(w0 * r), int(h0 * r)), interpolation=interp)’这段代码,不加上车道线数据集就报错