Redredhorse

Results 3 issues of Redredhorse

你好: 谢谢回复!我已下载并能够正常加载预训练模型~ 祝好 ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 发送日期 | 2023年08月17日 10:55 | | 收件人 | ***@***.***> | | 抄送人 | GaoJieXue ***@***.***>, Comment ***@***.***> |...

你好: 谢谢回复!我已下载并能够正常加载预训练模型~ 祝好 ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 发送日期 | 2023年08月17日 10:55 | | 收件人 | ***@***.***> | | 抄送人 | GaoJieXue ***@***.***>, Comment ***@***.***> |...

为什么在这里要直接将𝑄𝑡 = 𝐾𝑡 = ˆ 𝑋𝑡'(和𝑄𝑎 = 𝐾𝑎 = ˆ 𝑋𝑎 ′) 为什么不进行——用不同的W_k, W_Q来计算Q和K的操作呢