SparseTT icon indicating copy to clipboard operation
SparseTT copied to clipboard

请问推理部分是这么聚合两个头的结果的?

Open llz-lian opened this issue 2 years ago • 1 comments

是要用到其他结构吗?

llz-lian avatar May 24 '22 07:05 llz-lian

请问你复现这个代码了吗,结果精度差别大吗,我用了不同的GPU,got10k的结果差别很大,一般在百分之1左右。

ElliottZhen avatar Apr 28 '23 07:04 ElliottZhen