Qinyuan Cheng comments

Results 47 comments of


                                            Qinyuan Cheng

未来是否会支持多于两人的对话？

会的，目前正在开发中，感谢关注！

我测试了这个项目，发现该项目的词错率远远低于其他TTS项目，这主要是得益于什么部分？

感谢关注~ 主要得益于我们所使用的低帧率，语义声学统一离散化方案，大规模TTS预训练和比较精细的数据处理和后训练流程。

lora训练问题

Hi, 感谢测试。请尝试在推理时仍然提供参考音频进行续写，或在训练时调整LoRA相关参数。

微调数据量大概是多少时长

> prefix续写是更稳定吗 > > > > > 使用lora微调，50epoch左右 > > > > > > > > > 请问一下用单人数据微调之后是使用spkid还是prefix续写呢 > > > > > > prefix续写 @GuangChen2016 是的，prefix续写会更加稳定

微调训练问题

感谢反馈！请问在推理的时候有提供微调音色作为参考音频吗？

音色突变问题

Hi, 感谢关注！我们准备在Decoder阶段重新输入参考音频来增强对音色的遵循，目前正在测试新的Decoder~

Questions about cal_knowledge_quadrants

Yeah, the idk template is too strict for Idk-prompting. We directly whether "I don't know" in the response instead of the whole idk template for Idk-prompting.