Hillay Koon
Hillay Koon
是指中间输出的se吗? 可以单独调用OpenVoice的 se_extractor.py 从音频中提取音色特质后保存 也可以修改app.py中的第88行代码: target_se, audio_name = se_extractor.get_se(reference_speaker, tone_color_converter, target_dir='替换成你想保存的地址', vad=True)
是不能直接转换的,因为实际上是用了两个模型,模型与模型之间其实传的音频文件,两个模型的网络结构和参数是不能共用的
前级模型是ChatTTS的文字转语音模型,这一步想要稳定输出可以固定一个发音人seed,后级模型是OpenVoice的音色转换模型,se是它提取出来的音频的音色特征,这个特征是只能被音色转换模型识别并使用的
现在就是会自动应用克隆后的音色特征的,变得不像很有可能是ChatTTS的音色差异太大了,你可以通过ChatTTS的发音人seed来控制声线克隆之前的原声声线。原声音色尽量保持稳定。
> 1. clone code from https://github.com/myshell-ai/OpenVoice/tree/main, > 2. replace OpenVoice folder with the inner openvoice folder of new download project > 3. replace all 'openvoice' with 'OpenVoice' in import code...
>  感谢补充,确实是规整代码过程中遗漏了。
> >  > > 版主他写错了,你要将你ChatTTS-OpenVoice 文件里的OpenVoice改成小写openvoice ,APP代码中的所有“OpenVoice”替换为“openvoice”,将APP第一行 #import spaces 禁掉。就可以了 如果要改为小写,记得将文件夹名字改成小写
Space链接超时了,我已经重启啦!感谢提醒~
测试下来,可以用更长的音频,能学到更准确的特征