ChatTTS-Forge icon indicating copy to clipboard operation
ChatTTS-Forge copied to clipboard

[BUG] SSML duration/prosody 生成结果不对

Open zhzLuke96 opened this issue 5 months ago • 0 comments

Discussed in https://github.com/lenML/ChatTTS-Forge/discussions/151

Originally posted by hymch September 10, 2024 使用 From Subtitle 加載 字幕文件轉入SSML模塊後 如果改動 <voice duration=4000ms spk=".......> 中的duration 參數 將會改變語速,但這改變並不符合直覺 縮短duration 會令語速減慢,加大duration反而令語速加快 而且如此加減速對pitch的影響比使用调节器要小

此外 SSML使用 prosody 控制無效 本地和HF space都復現,文本如下:

<speak version="0.1">
    <voice spk="Bob" seed="42" style="narration-relaxed">
        使用 prosody 控制生成文本的语速语调和音量,示例如下 [lbreak]
        <prosody rate="0.5">
            设置 rate 大于1表示加速,小于1为减速 [lbreak]
        </prosody>
    </voice>
</speak>

後句語速不變 但用TTS模塊的调节器測試 速度=0.5 確可以調節

謝謝

zhzLuke96 avatar Sep 10 '24 06:09 zhzLuke96