Results 12 comments of gzhcv

I got the same issue, have you sloved it?

@xvjiarui thanks a lot for your help! I'll work on it

@xvjiarui Hi, another problem occured when running the function `check_gradient_dconv()` in `test.py`. (others function for checking in `test.py` seems running correctly ) > error in deformable_col2im_cuda: too many resources requested...

hello,我在用torch1.0版本时发现一个奇怪的问题。按照 @ww451575464 的方式修改了代码,在服务器A上运行没有问题。但是在服务器B上运行会卡在`main.py`的150行` data = val_iter.next()`,所以怀疑是读数据时卡住了,我把`num_work`参数设为0`num_work=0`后就能正常运行了。 我查了下这个参数的含义: > num_workers,从注释可以看出这个参数必须大于等于0,0的话表示数据导入在主进程中进行,其他大于0的数表示通过多个进程来导入数据,可以加快数据导入速度 服务器B的CPU配置是:物理CPU1个,6核,逻辑CPU核数总共12。 服务器A的CPU配置是:物理CPU2个,每个CPU有8核,逻辑CPU核数总共32。 难道是因为服务器B的CPU核数太少?(每个训练程序CPU占用率才100%,感觉有点奇怪,太少了,服务器B上用torch0.3版CPU占用率映像中能到600%,num_work=2) 因为num_work的数量设大一点可以加速,所以还是想能不能解决这个问题? 有什么建议嘛? @Canjie-Luo

@ww451575464 可能还是和num_work以及CPU配置有关。 我用enumerate和list试了一下,都卡在那里了。多试几次确实能奏效,不过我这得试很多次才成功,这也是很奇葩的现象

@Canjie-Luo 我这是暴殄天物,用了这多机器也没做出什么来。 您在资源有限的情况下能做出这么好的工作,佩服

@sheirving bilstm与特征reverse不是一回事。bilstm是考虑了上文和下文的信息,最重要的还是利用当前帧的(设为t)Input信息x_t来做预测;而特征reverse后,当前帧的Input信息其实来自于x_t和x_{L-t}(设特征序列长度为L)。