fish-speech
fish-speech copied to clipboard
[BUG]本地运行“启用参考音频”模式,合成后有80%的概率会出现最后一个字容易被吞掉和裁剪的情况。
首先感谢大佬们制作的这个强大技术。 在使用本地部署后,出现了几个问题。 1.原参考音频的首尾念字是完整的念完的。但是推理之后,就有很大概率会出现最后一个字被吞掉,或者最后一个字念一半被剪掉的情况。不启用参考音频模式基本上就不会有这个问题。 2.无论是否启用音频参考,在我输入“一,二,三,四,五。”汉字时,朗读会出现错误。比如出现“一 二 二 二 四”等无法正确朗读的现象,而且每个字似乎都被裁剪没说完。但当我输入“一二三四五”时,则不会出现。