Hillay Koon

Results 15 comments of Hillay Koon

是指中间输出的se吗? 可以单独调用OpenVoice的 se_extractor.py 从音频中提取音色特质后保存 也可以修改app.py中的第88行代码: target_se, audio_name = se_extractor.get_se(reference_speaker, tone_color_converter, target_dir='替换成你想保存的地址', vad=True)

是不能直接转换的,因为实际上是用了两个模型,模型与模型之间其实传的音频文件,两个模型的网络结构和参数是不能共用的

前级模型是ChatTTS的文字转语音模型,这一步想要稳定输出可以固定一个发音人seed,后级模型是OpenVoice的音色转换模型,se是它提取出来的音频的音色特征,这个特征是只能被音色转换模型识别并使用的

现在就是会自动应用克隆后的音色特征的,变得不像很有可能是ChatTTS的音色差异太大了,你可以通过ChatTTS的发音人seed来控制声线克隆之前的原声声线。原声音色尽量保持稳定。

> 1. clone code from https://github.com/myshell-ai/OpenVoice/tree/main, > 2. replace OpenVoice folder with the inner openvoice folder of new download project > 3. replace all 'openvoice' with 'OpenVoice' in import code...

> ![image](https://private-user-images.githubusercontent.com/29189137/365067030-712c06b0-5dc9-4b80-a1a6-a2496a96a55f.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3Mjg0ODUzMDIsIm5iZiI6MTcyODQ4NTAwMiwicGF0aCI6Ii8yOTE4OTEzNy8zNjUwNjcwMzAtNzEyYzA2YjAtNWRjOS00YjgwLWExYTYtYTI0OTZhOTZhNTVmLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDEwMDklMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQxMDA5VDE0NDMyMlomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPThiMzZmYzZiNzZhNGI1M2RhNWRjYzlmNWE4MmVlNmVjOTkzOGVmZTQyYmRjYjdlNzkzMTYyYzA0NDAxY2ZjMjQmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0In0.bgaH5g_Z7jDw3UHAQB32L1149bVfI3pq-V6Hm60D5LM) 感谢补充,确实是规整代码过程中遗漏了。

> > ![图像](https://private-user-images.githubusercontent.com/29189137/365067030-712c06b0-5dc9-4b80-a1a6-a2496a96a55f.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MzAzNjAxNjYsIm5iZiI6MTczMDM1OTg2NiwicGF0aCI6Ii8yOTE4OTEzNy8zNjUwNjcwMzAtNzEyYzA2YjAtNWRjOS00YjgwLWExYTYtYTI0OTZhOTZhNTVmLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDEwMzElMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQxMDMxVDA3MzEwNlomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTgxN2M1ZmQxNDNjZjliMGZlZmIwZjFmZWRhMDBjZTczMjZhNzcyZGU3MjA0NGIxMGYyNjJkM2EwMGIzOWY4MGUmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0In0.CKQt_9O42cYzlRLshUeNi_Mb3Wrv3_v8-FSBOcmILRo) > > 版主他写错了,你要将你ChatTTS-OpenVoice 文件里的OpenVoice改成小写openvoice ,APP代码中的所有“OpenVoice”替换为“openvoice”,将APP第一行 #import spaces 禁掉。就可以了 如果要改为小写,记得将文件夹名字改成小写

Space链接超时了,我已经重启啦!感谢提醒~

测试下来,可以用更长的音频,能学到更准确的特征