Qinyuan Cheng
Qinyuan Cheng
会的,目前正在开发中,感谢关注!
感谢关注~ 主要得益于我们所使用的低帧率,语义声学统一离散化方案,大规模TTS预训练和比较精细的数据处理和后训练流程。
Hi, 感谢测试。 请尝试在推理时仍然提供参考音频进行续写,或在训练时调整LoRA相关参数。
> prefix续写是更稳定吗 > > > > > 使用lora微调,50epoch左右 > > > > > > > > > 请问一下用单人数据微调之后是使用spkid还是prefix续写呢 > > > > > > prefix续写 @GuangChen2016 是的,prefix续写会更加稳定
感谢反馈! 请问在推理的时候有提供 微调音色作为参考音频吗?
Hi, 感谢关注! 我们准备在Decoder阶段重新输入参考音频来增强对音色的遵循,目前正在测试新的Decoder~
Yeah, the idk template is too strict for Idk-prompting. We directly whether "I don't know" in the response instead of the whole idk template for Idk-prompting.