dVectorSpeakerRecognition icon indicating copy to clipboard operation
dVectorSpeakerRecognition copied to clipboard

關於網路輸入 帧拓展

Open chrismonent opened this issue 3 years ago • 3 comments

你好

想請問原本的論文所使用的帧拓展

做完framing和mel filter之後 (假設為300個frame, 40 mel)

  1. 取中間值第150個frame的前40和後10個frame,共51個frame當作輸入
  2. 從第41個fame後,取每個frame的前40和後10個frame當作輸入

以上2點並在最後攤平整合成一個[1, *]的輸入

請問是哪一個,謝謝

chrismonent avatar Dec 04 '21 14:12 chrismonent

不好意思,我已经好久好久没有接触过相关内容了,忘记了您说的问题,您具体可以看下

您要不看下https://github.com/philipperemy/deep-speaker,看着它还在维护,

------------------ 原始邮件 ------------------ 发件人: "wangleiai/dVectorSpeakerRecognition" @.>; 发送时间: 2021年12月4日(星期六) 晚上10:34 @.>; @.***>; 主题: [wangleiai/dVectorSpeakerRecognition] 關於網路輸入 帧拓展 (Issue #5)

你好

想請問原本的論文所使用的帧拓展

做完framing和mel filter之後 (假設為300個frame, 40 mel)

取中間值第150個frame的前40和後10個frame,共51個frame當作輸入

從第41個fame後,取每個frame的前40和後10個frame當作輸入

以上2點並在最後攤平整合成一個[1, *]的輸入

請問是哪一個,謝謝

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

wangleiai avatar Dec 04 '21 14:12 wangleiai

好的感謝你的回覆

順便想問一下如果照你的輸入方法 最後的準確率為多少

謝謝

chrismonent avatar Dec 04 '21 15:12 chrismonent

具体真的忘了

------------------ 原始邮件 ------------------ 发件人: "wangleiai/dVectorSpeakerRecognition" @.>; 发送时间: 2021年12月4日(星期六) 晚上11:05 @.>; @.@.>; 主题: Re: [wangleiai/dVectorSpeakerRecognition] 關於網路輸入 帧拓展 (Issue #5)

好的感謝你的回覆

順便想問一下如果照你的輸入方法 最後的準確率為多少

謝謝

— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

wangleiai avatar Dec 04 '21 15:12 wangleiai