yujialele
yujialele
您好,我想请教您几个问题? (1)在resnet50里, 代码实现中attemtion map 的数量为32,是每一个attention map 和原来的最后一个bottleneck里的卷积层特征相乘。我想问的是attention map是如何生成。 (2)能否采用像imporved bilinear pooling的方法改良整个代码。
可视化
您好,我想知道AOLM模块是如何可视化的。
你好,提供的vgg权重文件打不开,麻烦可以重新提交一下吗。
I have downloaded the overall required data from one driver . I try to run your code, but i find the train.txt is not in the split. Please provide the...
How to split rare first datasets and non-rare datasets on HICO-DET. And please provide Unseen object list for me
你好,我看到视频数据集A2D你代码那里读取的是frame,这个是如何处理的,方便提供一下数据集吗?
你好,我看到你论文中写道你随机挑选了20个verb,但是我根据你提供的UA_list我一共找到了36种不同的verb,包含no_interaction,这是因为你挑选的verb的图片里不可避免的存在其他verb的HOI,所以把它们也加入到unseen集合中吗?还有你挑选了 很多hold构成的HOI组合,但是我发现有很多hold+object的组合没有被找全,这是什么原因?即使hold本身存在的语义歧义,但是hold dog 和 hold sheep应该都是牵着的含义,但是hold sheep并没有出现在你的UA中。您能否提供一下关于unseen_object和unseen_verb各自的id和类别,不是最终的组合类别。
您好, 我对您的工作身份感兴趣,我在ssw生成cub200数据那里有一些问题,希望您可以提供一下cub200生成数据集的代码。
Thank you for your best work! I follow your introduction but fail to download the datasets. Please provide the datasets download links in your paper and give me a more...
Thank you for your good work! I recently have read your code and generated some questions. I find that channel-spatial cross-attention module is projected into multi-head attention and the FFN...