Vincent Zhang
Results
2
comments of
Vincent Zhang
@liyuanyaun I have encountered this problem too. After discard the shuffle operation in RoIDataLayer(),and locate which image the error occurs. I found that one of the bounding boxes has xmin=0,...
我在其他project里遇到过类似的问题,搜索到了这个issue,具体来说,python包都是正常安装的,但是就是在DDP模型构建的时候出错了,exitcocde=-11。 我尝试了在一开始运行时设置init_process_group的backend为gloo,是可以跑起来的,但是速度会降一些。 回到nccl后端,把pytorch版本降低到1.10.0+cu113(不一定非得是这个,可以多尝试几个版本)之后,运行就正常了,可以试试。@kydbj