LUO77123
LUO77123
> Here: https://github.com/ShoufaChen/AdaptFormer/blob/main/main_video.py#L340-L348 Thanks, I have modified the adjustment, but I don't know the three values (mid_dim=64, dropout=drop, S=0.1). mid_dim's experiment in the paper proves that it takes 64. Dropout...
请问你换了swin-transformer的GFLOPs有多大?
> 请问你换了swin-transformer的GFLOPs有多大? 兄弟,请问你换了swin-transformer的GFLOPs有多大?
> 大佬,我想麻烦请问下我看论文中swin transformer block都是成对出现的,你代码中SwinTransformerLayer的具体结构是不是只是下面的一半,比如1个C3STR模块内部堆叠了4个SwinTransformerLayer,那这3个并不一定完全是按照W-MSA,SW-MSA,W-MSA,SW-MSA,这样排的吗? 也可能是W-MSA,W-MSA,SW-MSA,W-MSA这样排的对吗? > > 我也刚接触swin transformer ,可能说的不太清楚,主要就是对这个代码中的SwinTransformerLayer网络结构不太清楚,谢谢您了。 > >  兄弟,你跑了代码吗,想知道采用swin transformer占显存有多大,1120的输入我的占7-8G
> 我犯了个低级错误,新建Tensor的时候没有指定device,所以产生了这个报错。已经改掉了。你pull下来试试。 好的,我在试一下,cuda版本我用到yolov5中,网络没有学到信息,不知道是不是编译的问题,这次试一下debug版本。
debug 版本网络可以学到信息,loss在减少了,谢谢大佬
另外,大佬如何修改可以不用cuda加速喃
发现问题所在了,diou中w, h = enclosing_box(corners1, corners2, enclosing_type),返回的w, h会有1-2变成喃,导致后续都nan,这块代码能看是bug吗
> > 发现问题所在了,diou中w, h = enclosing_box(corners1, corners2, enclosing_type),返回的w, h会有1-2变成喃,导致后续都nan,这块代码能看是bug吗 > > 能不能提供触发这个bug的测试代码呢?我没有遇到过这个问题。 大佬,我是将你的代码替换yolov5的box计算,进行旋转检测,避免nan修改如下  但是网络学习不到东西  我在尝试一下debug版本,
> > 发现问题所在了,diou中w, h = enclosing_box(corners1, corners2, enclosing_type),返回的w, h会有1-2变成喃,导致后续都nan,这块代码能看是bug吗 > > 能不能提供触发这个bug的测试代码呢?我没有遇到过这个问题。 iou_loss查了,有一个nan,反查是W里面出现一个nan  继续查,  接着是  应该是 ----》 proj = point_line_projection_range(lines, points) # (..., 24) 里面有问题