45xjh
45xjh
> @45xjh I also have this problem, would you be able to solve it? can you tell me how to implement it? I can not solve it,sorry
> train: preprocess_stage1:wav->hubert,text->bert stage1: hubert->token----(+text+reference_encoder_embedding)---->wav (sovits) preprocess_stage2:hubert->token stage2: tokens+bert+text->tokens (gpt (More accurately, it is Soundstorm stage_AR.)) > > fine tune: preprocess_stage:wav->hubert->token,text->bert stage1: token------(+text+reference_encoder_embedding)----->wav (sovits_decoder) stage2: tokens+bert+text->tokens (gpt) > > inference:...
可以将你要合成的台词写在一个txt,然后读取就可以一句话一个语音,推理的时候写循环就行了
where are you from?
> 这个项目目前是TTS,不是SVC 那兄弟 这个s2D488k和s2G488k是作者自己训的吗
> 无 > > 楼上:当然 您好作者,请问这个是用什么数据集训练的,用的什么GPU设备,训练了多久的呢,还有就是代码里面其他的预训练模型:Chinese-roberta和Chinese-hubert以及s1bert25hz的来源是哪里呢
可以参考我的,都整到.py文件了,可以实现命令行运行,觉得有用可以给一颗星支持一下哦,感谢! https://github.com/45xjh/GPT-SoVITS-ForNoGUI
> > > 该仓库无太大可能脱离webUI训练,准备数据集必须webUI > > > > > > 如果自行根据已有代码把整个流程用代码方式实现,您能麻烦大致评估一下需要多大的工作量呢? > > data:image/s3,"s3://crabby-images/68419/684190eb7651f5dc6f8948f0915545cc08dc84d8" alt="image"数据集准备这种sys.argv取消注释就行,然后训练以及别的的命令详见webUI.py里面,点击按钮时会输出的 是的 我的就是按照webUI.py里的按钮触发的函数执行步骤和参数一个个整到py文件的
> > > > > 该仓库无太大可能脱离webUI训练,准备数据集必须webUI > > > > > > > > > > > > > > > > > > > > > > > >...
慢慢调epoch看训练多少epoch效果好