zachx121

Results 1 issues of zachx121

目前似乎是通过长文本拆分后,逐个短句推理并返回来实现“流式”的,请教各位佬,有可能不拆文本吗?比如文本会生成2s的音频,有可能让模型每合成0.5s的音频片段就返回吗?