ms-swift
ms-swift copied to clipboard
72B的模型首字延时如何减少
部署了qwen1.5-72B的模型,测试流式首字延时大概在1.6s,通过什么参数能够减少首字延时呢,求大神