BeyondLightYear

Results 1 comments of BeyondLightYear

> SV + ASR 多谢多谢!尝试了一下,方案是: 1 切分语音片段 --> 2 声纹识别(比较切片的声纹 区分不同的说话人 但比较耗时) --> 3 结合语音片段 和 整个音频的asr结果 又有了新问题: 1 不能很好的分割音频片段(即:一个片段只包含一个人的语音) 2 对电话录音,声纹识别的效果似乎不太好(2人以上的对话 处理起来也很耗时) 3 asr的识别结果(无时间戳) 和 音频片段无法很好对应起来 麻烦多多指点一下,我的方案不合理的部分,或者能更具体的说一下咱们paddle的方案吗? 万分感谢!