PQCache icon indicating copy to clipboard operation
PQCache copied to clipboard

关于128k长度的上下文

Open ydyhello opened this issue 1 year ago • 3 comments

您好,请问您尝试过更长的文本吗?比如128k。 当我尝试128k的上下文时,将一直停留在prefill阶段的kmeans阶段,这是否超过了cpu负载? 如果您可以提供相关的解决方案,我将不胜感激!

ydyhello avatar Jan 08 '25 10:01 ydyhello

您好,我们尝试过更长的文本。理论上来说,gpu计算时间相对文本长度复杂度是O(s^2),而cpu计算时间是O(s),因此更长的文本下cpu的kmeans计算不应是瓶颈。您可以看看是否遇到了其他bug导致程序卡住。

HugoZHL avatar Jan 09 '25 02:01 HugoZHL

非常感谢您的回复! 我将kmeans最大迭代次数设为1时,解决了这个问题。

ydyhello avatar Jan 12 '25 12:01 ydyhello

你好,设置成1可能不太合理,你可以从这个版本出发,尝试减小pq的配置,或者debug看看有没有其他地方阻塞了程序正常运行

HugoZHL avatar Jan 16 '25 07:01 HugoZHL