lmdeploy icon indicating copy to clipboard operation
lmdeploy copied to clipboard

想请教怎么往kv cache中添加缓存信息

Open WCwalker opened this issue 1 year ago • 2 comments

Motivation

想请教怎么往kv cache中添加缓存信息,我这边在做batch推理时候,因为batch比较多,想缓存提示词模版,以减少推理时间

Related resources

No response

Additional context

No response

WCwalker avatar Jan 19 '24 01:01 WCwalker

1705628758115 想请教的是这一段描述我应该去哪里找对应的代码,然后把我这边提示词的内容填充进去

WCwalker avatar Jan 19 '24 01:01 WCwalker

为避免误解,能不能提供个具体例子?便于我们针对性的讨论 我感觉 lmdeploy 的交互式推理方式能帮到忙。它会cache多轮对话中的历史记录

lvhan028 avatar Jan 19 '24 02:01 lvhan028