bei123
https://cloudreve.2000gallery.art/f/pLoUL/audio%20%281%29.wav 我这里测试没有问题也是按四句切分
@jax-explorer https://cloudreve.2000gallery.art/f/1Qvu7/audio%20%283%29.wav 那我换个模型,又换了个长参考音频,输出结果也是十秒以上,你还是检查一下自己模型训练的问题吧