MOSS-TTSD icon indicating copy to clipboard operation
MOSS-TTSD copied to clipboard

生成音频开始的地方有奇怪的嗯啊口语

Open Jandown opened this issue 5 months ago • 2 comments

RT,有时候听着正常,有时候听着就很奇怪,大家发现没?

Jandown avatar Jul 18 '25 15:07 Jandown

你好,感谢关注~ 因为这版模型是通过续写的方式来做音色克隆的,所以如果Speech prompt有截断的话会发生续写prompt的情况。请尝试调整prompt,或者在修改generation_utils.py第13行SILENCE_DURATION = 0.0的值为0.1,避免生成音频续写prompt被截断的部分。

xiami2019 avatar Jul 23 '25 08:07 xiami2019

你好,感谢关注~ 因为这版模型是通过续写的方式来做音色克隆的,所以如果Speech prompt有截断的话会发生续写prompt的情况。请尝试调整prompt,或者在修改generation_utils.py第13行SILENCE_DURATION = 0.0的值为0.1,避免生成音频续写prompt被截断的部分。

好的,感谢解答

Jandown avatar Jul 23 '25 09:07 Jandown