tiaotiaosong
Results
1
comments of
tiaotiaosong
> 非vLLM 版本流式输出效果不降,LLM推理大概610ms,flow开启trt190ms,听到第一段Speech大概810ms。 请问一下用的什么硬件配置,有没有教程?