SINE
SINE copied to clipboard
Results
1
SINE issues
Sort by
recently updated
recently updated
newest added
1. X_hat^u 加上X^u的残差为什么没在论文中提及? 2. C^u_apt 缺少LayerNorm4以及后续多出来的运算? 3. (7)的τ去哪了 4. (3)里面为什么有τ 5. (3)的W3去哪了 6. (5)的LayerNorm3在哪 7. 很多地方加上了position_embedding, 论文为什么不提及? ------------ 1. why is the residual of X_hat^u plus X^u not mentioned in...