VALL-E-X icon indicating copy to clipboard operation
VALL-E-X copied to clipboard

生成的音频是杂音

Open yangyi-hup opened this issue 1 year ago • 3 comments

你好: 我在按照说明文中的基本使用方法,使用下载的预训练模型直接生成时遇到了问题:生成的是空白杂声音频。 运行python -X utf8 launch-ui.py进入用户交互界面生成的音频同样如此。 但是使用您提供的在线演示链接打开进行生成的结果却是正常的,不明白哪里出了问题? (vallex_checkpoint.pt和vocos模型均在指定链接下载。)

yangyi-hup avatar Dec 07 '23 07:12 yangyi-hup

是的 ,中文声音有很大问题,杂音太多了

kill136 avatar Jan 08 '24 09:01 kill136

@yangyi-hup 可能是背景噪声的问题,这个模型会尝试保留音乐、环境噪声等声音。要干净没杂音的声音才能生成的比较好。可以分享一下你用来生成的音频让我测试一下看看问题在哪。

hkzbiyx avatar Jan 13 '24 13:01 hkzbiyx

我即使输入和输出都是英文,也出现了这个问题

Vic1025 avatar Mar 22 '24 12:03 Vic1025