InfLLM icon indicating copy to clipboard operation
InfLLM copied to clipboard

代码context_manager.py上的问题

Open YL-9 opened this issue 1 year ago • 3 comments

你好,我读了context_manager的代码之后有几点问题,能否解答下:

  1. get_global_hidden_and_mask 函数中,kv 拼接顺序为什么是 block+init+local,而不是 init+block+local
  2. _append 函数中,global_h_q, global_h_k, global_h_v 似乎未使用 rope

~~(代码注释太少,,刚看起来参数都不知道什么含义~~

YL-9 avatar Sep 21 '24 14:09 YL-9

  1. 顺序对结果没有影响,计算是等价的
  2. global_h_q 已经做过旋转了,global_h_k 没做 rope 相当于旋转 0 度

如果只需要对应论文算法的代码,初始版本会好读一些,目前的版本优化了性能。

guyan364 avatar Sep 21 '24 15:09 guyan364

  1. 顺序对结果没有影响,计算是等价的
  2. global_h_q 已经做过旋转了,global_h_k 没做 rope 相当于旋转 0 度

如果只需要对应论文算法的代码,初始版本会好读一些,目前的版本优化了性能。

好的感谢! 请问你们有没有做过对 global_h_k 做旋转的相关实验呢

YL-9 avatar Sep 23 '24 12:09 YL-9

好的感谢! 请问你们有没有做过对 global_h_k 做旋转的相关实验呢

目前没有,因为按照rerope的长度拓展应该使用相同的旋转角度,你可以尝试一下其他旋转方法

guyan364 avatar Sep 30 '24 06:09 guyan364