cross_view_transformers The softmax attention do not use a cosine similarity

The softmax attention do not use a cosine similarity

Open songlilucky opened this issue 2 years ago • 1 comments

Thanks for your work. according to your code, softmax attention do not use a cosine similarity,Did I get something wrong?

Nov 10 '22 06:11 songlilucky

    # Dot product attention along cameras
    dot = self.scale * torch.einsum('b n Q d, b n K d -> b n Q K', q, k)
    dot = rearrange(dot, 'b n Q K -> b Q (n K)')
    att = dot.softmax(dim=-1)

Nov 10 '22 07:11 songlilucky

cross_view_transformers cross_view_transformers copied to clipboard

The softmax attention do not use a cosine similarity

cross_view_transformers
cross_view_transformers copied to clipboard