CosyVoice icon indicating copy to clipboard operation
CosyVoice copied to clipboard

合成的音频为什么会有提示词文本内容?

Open eddie-292 opened this issue 3 weeks ago • 10 comments

Image

zeroShotTTS.wav

eddie-292 avatar Dec 16 '25 03:12 eddie-292

我也是

Aye111111 avatar Dec 16 '25 03:12 Aye111111

+1 还会随机重复

Jandown avatar Dec 16 '25 04:12 Jandown

+1 还会随机重复

jerrytt avatar Dec 16 '25 06:12 jerrytt

+1 在生成的文本前会有几个不明所以的文字,我还以为是我提示词写错了,但是我用的默认的prompt还是一样的

828Tina avatar Dec 16 '25 07:12 828Tina

同上

xbl916 avatar Dec 16 '25 08:12 xbl916

参考音频的提示词前加这个“You are a helpful assistant.<|endofprompt|>”

Imxxoo avatar Dec 16 '25 09:12 Imxxoo

幻觉很严重,合成10句有两句有重复合成。

wincing2 avatar Dec 16 '25 12:12 wincing2

参考音频的提示词前加这个“You are a helpful assistant.<|endofprompt|>”

这是对的,我翻了一下创空间的3秒复刻代码里面有这个prompt

RyrieNorth avatar Dec 16 '25 17:12 RyrieNorth

对,但经过find-tune后就没有这个问题了

Unturnd @.***

RyrieNorth avatar Dec 17 '25 02:12 RyrieNorth

Image

donstang avatar Dec 18 '25 11:12 donstang