VoxCPM
VoxCPM copied to clipboard
声音错乱以及结束符判定问题
目前部署的nano-vllm的版本,感觉使用下来有几个问题
- 因为推理是传入参考文本和目标文本一起的,所以参考文本的结束符号会影响目标文本,使用下来参考文本的英文标点符号不会判定为文本结束,导致参考文本的结尾几个字
- 克隆出来的语音和参考音色不一致, 甚至性别会变
还有对音频质量要求太高了,如果参考音频开始有杂音或者静音段,推理出来的音频完全就是错误的