wwfcnu
wwfcnu
> 目前只支持中文呢。 > > 英文同音词组,非常少吧? 有那种中英混的,比如原本是“西配殿”,识别的是“C配电”
这个现在是支持(system prompt +文本指令+语音 -->text)的微调吗
> Talker模块我们正在加紧研究,今明应该可以弄好text-audio输入的微调~ 我看代码里只有text-image输入的微调
我也遇到了这种情况,应该怎么改呀
我训练的日志也是这样的,你解决了吗
想问一下这个怎么下载一个账号下的所有视频呀,我这里配置完settings.json,终端显示共有0个账号
这种感觉只有结合上下文才能知道2024是年份,正则匹配不太能辨别
> > v3版本的sovits部分已经不是vits架构了,是DiT。这个模型严重拖慢了整体推理速度,已经再想办法优化了 > > V3这个是参考的cosyvoice2的Dit+BigVGan吗? cosyvoice是flow matching +hifigan吧
我也想问这个无标签的数据在哪可以获取呢