VoxCPM icon indicating copy to clipboard operation
VoxCPM copied to clipboard

声音错乱以及结束符判定问题

Open Monica8023 opened this issue 2 months ago • 1 comments

目前部署的nano-vllm的版本,感觉使用下来有几个问题

  1. 因为推理是传入参考文本和目标文本一起的,所以参考文本的结束符号会影响目标文本,使用下来参考文本的英文标点符号不会判定为文本结束,导致参考文本的结尾几个字
  2. 克隆出来的语音和参考音色不一致, 甚至性别会变

Monica8023 avatar Dec 26 '25 06:12 Monica8023

还有对音频质量要求太高了,如果参考音频开始有杂音或者静音段,推理出来的音频完全就是错误的

Monica8023 avatar Dec 26 '25 07:12 Monica8023