Efficient-GlobalPointer-torch
Efficient-GlobalPointer-torch copied to clipboard
请问这个Efficient-GP实现的是第二个公式吗?
是不是对这个公式的实现sα(i,j)=(Wqhi)⊤(Wkhj)+w⊤αhi;hj ,不是对sα(i,j)=q⊤ikj+w⊤αqi;ki;qj;kj 的实现