learn-nlp-with-transformers
learn-nlp-with-transformers copied to clipboard
2.2-图解transformer公式错误
Self-attention细节部分 2-3的分数score计算,按照文中讲解,分子应该是qk,而不是qq
Self-attention细节部分 2-3的分数score计算,按照文中讲解,分子应该是qk,而不是qq