jiangshan1xiao
Results
1
comments of
jiangshan1xiao
> 重新训练模型,解决了 > > 测试: 我将原本的短句,小于3秒的全部用脚本删除,将太短的进行合并,然后在一个一个进行标注校对,发现确实有没有读完的asr,比如期间,他只读了一个期,但是文字上asr识别出期间。这种我都进行了删除。将分离的有问题的,进行了合并,不连贯的也全都删除了。 > > 结果: 用修改后的数据合成的新模型,再使用同样的语句的时候,没有发现这样的问题。 > > 这些天遇到的合成问题总结: 1.**如果音质有问题** 改预测音频和文案 2.如果有**多读的情况,或者带了预测音频的内容** 检查预测音频和文案是否清晰,是否为完整的一句,并且用短句合成在拼接,建议控制20字以内(20字以内都没出现这种情况) 3.如果有几个重复的字在一起的时候,**发现了重读或者只读一个** 比如,道可道,非常道。这里面就有2个字很近,这就有可能忽略,建议短句合成在拼接,发现就没有这种情况了 4.如果用了短句合成后,最后还**末尾漏字或者读音不准**,或者**不通顺** 查看asr和对应的音频进行重新标注,把读音不准的句子里面的字给替换,或者把不通顺的给删除,然后重新进行训练 我也出现了这种情况,多谢踩坑,我试试你的方法吧