devsky

Results 35 comments of devsky

> 那应该是vllm安装没有成功 直接docker部署的 如何从新安装,大神指点 root@a73600e73869:/workspace# pip show vllm Name: vllm Version: 0.4.0 Summary: A high-throughput and memory-efficient inference and serving engine for LLMs Home-page: https://github.com/vllm-project/vllm Author: vLLM Team Author-email: License:...

什么时候能处理一下

是的 每次返回都是两张 触发两次请求 我一开始以为网络问题 加了限流还那样

billingUsage 这个接口顺便问下大神 什么时候跟新最新升级的gpt

我指的是3·5 16k 和函数调用,超时时间我已指定 但是还是有错误

没太明白 传到req.setMessage 里面吗 有没有示例代码 大神

这个上下文只能传一个吗? req.setPrompt(res.getAnswer() + "\n" + "Human: 你叫什么");