PaddleSpeech
PaddleSpeech copied to clipboard
中英混合模型效果很差
我是使用的paddlespeech-r1.4.1,代码为:
from paddlespeech.cli.tts.infer import TTSExecutor
tts = TTSExecutor()
am = "fastspeech2_mix"
voc = "hifigan_aishell3"
output = f"{am}-{voc}.wav"
tts(text="今天天气十分good。I am jack, What's your name?",
output=output,
lang="mix",
am=am,
voc=voc)
print(f"output: {output}")
尝试了fastspeech2_mix-hifigan_aishell3; fastspeech2_mix-hifigan_csmsc和fastspeech2_mix-pwgan_aishell3,效果都不太好。请问是我的设置有问题吗?
wav文件在下面的zip包里:
开发者你好,感谢关注 PaddleSpeech 开源项目,抱歉给你带来了不好的开发体验,目前开源项目维护人力有限,建议参考:https://github.com/PaddlePaddle/PaddleSpeech/discussions/1842
想问下,楼主有测试过其他模型吗?
请问tts_online_ws_application.yaml如果改成混合模型fastspeech2_mix该怎么修改