vits_chinese
vits_chinese copied to clipboard
停顿是如何实现的?
大概看了下是通过bert提取char embedding,和音素拼接输入给模型,没有看到停顿是如何处理的。