LUO77123

Results 43 comments of LUO77123
trafficstars

> Here: https://github.com/ShoufaChen/AdaptFormer/blob/main/main_video.py#L340-L348 Thanks, I have modified the adjustment, but I don't know the three values (mid_dim=64, dropout=drop, S=0.1). mid_dim's experiment in the paper proves that it takes 64. Dropout...

请问你换了swin-transformer的GFLOPs有多大?

> 请问你换了swin-transformer的GFLOPs有多大? 兄弟,请问你换了swin-transformer的GFLOPs有多大?

> 大佬,我想麻烦请问下我看论文中swin transformer block都是成对出现的,你代码中SwinTransformerLayer的具体结构是不是只是下面的一半,比如1个C3STR模块内部堆叠了4个SwinTransformerLayer,那这3个并不一定完全是按照W-MSA,SW-MSA,W-MSA,SW-MSA,这样排的吗? 也可能是W-MSA,W-MSA,SW-MSA,W-MSA这样排的对吗? > > 我也刚接触swin transformer ,可能说的不太清楚,主要就是对这个代码中的SwinTransformerLayer网络结构不太清楚,谢谢您了。 > > ![1](https://user-images.githubusercontent.com/59409902/162577020-866eeaca-6e8a-4328-8003-2b9d4fbe65b4.png) 兄弟,你跑了代码吗,想知道采用swin transformer占显存有多大,1120的输入我的占7-8G

> 我犯了个低级错误,新建Tensor的时候没有指定device,所以产生了这个报错。已经改掉了。你pull下来试试。 好的,我在试一下,cuda版本我用到yolov5中,网络没有学到信息,不知道是不是编译的问题,这次试一下debug版本。

debug 版本网络可以学到信息,loss在减少了,谢谢大佬

发现问题所在了,diou中w, h = enclosing_box(corners1, corners2, enclosing_type),返回的w, h会有1-2变成喃,导致后续都nan,这块代码能看是bug吗

> > 发现问题所在了,diou中w, h = enclosing_box(corners1, corners2, enclosing_type),返回的w, h会有1-2变成喃,导致后续都nan,这块代码能看是bug吗 > > 能不能提供触发这个bug的测试代码呢?我没有遇到过这个问题。 大佬,我是将你的代码替换yolov5的box计算,进行旋转检测,避免nan修改如下 ![image](https://user-images.githubusercontent.com/87272337/180944371-5589c27a-2f27-4532-bd7d-f3f672078a47.png) 但是网络学习不到东西 ![image](https://user-images.githubusercontent.com/87272337/180944705-e9eb4771-6cf9-418a-b8cd-864c2a15ded4.png) 我在尝试一下debug版本,

> > 发现问题所在了,diou中w, h = enclosing_box(corners1, corners2, enclosing_type),返回的w, h会有1-2变成喃,导致后续都nan,这块代码能看是bug吗 > > 能不能提供触发这个bug的测试代码呢?我没有遇到过这个问题。 iou_loss查了,有一个nan,反查是W里面出现一个nan ![image](https://user-images.githubusercontent.com/87272337/180945382-0e029046-a36f-47b1-8d17-d704bf2b4215.png) 继续查, ![image](https://user-images.githubusercontent.com/87272337/180947757-b525a979-ffc1-4fef-b62f-7bcc2d502d88.png) 接着是 ![image](https://user-images.githubusercontent.com/87272337/180946387-170b0158-47d3-4dbb-a22d-ba59cc4f5861.png) 应该是 ----》 proj = point_line_projection_range(lines, points) # (..., 24) 里面有问题