Lennon-cheng comments

Results 6 comments of


                                            Lennon-cheng

请教语音克隆，音质优化的方向

用真实语音文件，转成梅尔谱图，灌到vocoder模型中。发现声码器模型基本没问题，预估问题还是在合成器中吧。 [归档.zip](https://github.com/PaddlePaddle/PaddleSpeech/files/9358826/default.zip) 压缩包中包含了：原声音文件；真实音转成mels，直接灌到 vocoder 模型。分别测试了官方的pwg_aishell3；pwg_baker；自己训练的pwg_aishell3；克隆后的语音；还想了解下， 1. 语音合成后有后处理的方案，缓解字的清晰度、沙沙等问题吗？ 2. 合成器训练，从数据上、调参上有什么经验吗？我目前是用AIshell3 + 自己的声音，用官方example/aishell3/vc1 中的方式训练。数据上，之后想尝试用三方的TTS接口生成语音训练。另外想训练时吧 voice_clone 关掉，排除下是否为声纹模型的问题。

Lennon-cheng

请教语音克隆，音质优化的方向

请教语音克隆，音质优化的方向

[tts] Multilingual Speech Synthesis 中英文混合语音合成

fnlp/moss-moon-003-sft-int4 量化版本报错

fnlp/moss-moon-003-sft-int4 量化版本报错

NameError: name 'autotune' is not defined

Lennon-cheng

请教语音克隆，音质优化的方向

请教语音克隆，音质优化的方向

[tts] Multilingual Speech Synthesis 中英文混合语音合成

fnlp/moss-moon-003-sft-int4 量化版本 报错

fnlp/moss-moon-003-sft-int4 量化版本 报错

NameError: name 'autotune' is not defined

fnlp/moss-moon-003-sft-int4 量化版本报错

fnlp/moss-moon-003-sft-int4 量化版本报错