BeyondLightYear comments

Repositories
Issues
Comments

Results 1 comments of


                                            BeyondLightYear

怎样对多人对话音频，进行说话人区分？

> SV + ASR 多谢多谢！尝试了一下，方案是： 1 切分语音片段 --> 2 声纹识别(比较切片的声纹区分不同的说话人但比较耗时) --> 3 结合语音片段和整个音频的asr结果又有了新问题： 1 不能很好的分割音频片段（即：一个片段只包含一个人的语音） 2 对电话录音，声纹识别的效果似乎不太好（2人以上的对话处理起来也很耗时） 3 asr的识别结果(无时间戳) 和音频片段无法很好对应起来麻烦多多指点一下，我的方案不合理的部分，或者能更具体的说一下咱们paddle的方案吗？万分感谢！