whuhit
whuhit
can you release your pretrained model?
您好,我看ppt里描述的,输入是(5000,8),请问这个8是作为通道8,还是高、宽8呢?前者的话,就是bn * 8 * 5000 * 1,后者的话就是bn * 1* 5000 * 8。
 根据文章中这个图像的描述,STDC输入的是一个通道为M的特征图,经过4个block之后,得到的通道数分别为N/2, N/4, N/8, N/8,然后做一次特征融合,得到一个通道为N的特征图。 但是代码中  这里的输出显然不是这样的。是我理解错误吗?大佬方便解释一下么
is there any inference demo code?
demo推理疑惑
我想请教一下demo推理中的问题,这个模型训练的不是视频动作吗,demo中的推理每次都只用一帧数据,直接复制成16份去推理吗?这不就是单帧的目标检测吗