Baichuan-13B
Baichuan-13B copied to clipboard
模型部署到服务器推理部署刚启动时对话速度很快,对话几句之后速度变得很慢,请问是什么原因?
see https://github.com/baichuan-inc/Baichuan-13B/issues/12