InfLLM
InfLLM copied to clipboard
代码context_manager.py上的问题
你好,我读了context_manager的代码之后有几点问题,能否解答下:
- get_global_hidden_and_mask 函数中,kv 拼接顺序为什么是 block+init+local,而不是 init+block+local
- _append 函数中,global_h_q, global_h_k, global_h_v 似乎未使用 rope
~~(代码注释太少,,刚看起来参数都不知道什么含义~~
- 顺序对结果没有影响,计算是等价的
- global_h_q 已经做过旋转了,global_h_k 没做 rope 相当于旋转 0 度
如果只需要对应论文算法的代码,初始版本会好读一些,目前的版本优化了性能。