dVectorSpeakerRecognition
dVectorSpeakerRecognition copied to clipboard

Published 20 hours ago •

→

Metadata

基于dVector的说话人识别keras

Reame
Issues

Results 4 dVectorSpeakerRecognition issues

Sort by recently updated

關於網路輸入帧拓展

3

comment

你好想請問原本的論文所使用的帧拓展做完framing和mel filter之後（假設為300個frame, 40 mel） 1. 取中間值第150個frame的前40和後10個frame，共51個frame當作輸入 2. 從第41個fame後，取每個frame的前40和後10個frame當作輸入以上2點並在最後攤平整合成一個[1, *]的輸入請問是哪一個，謝謝

你好关于网络的输入

请问声学特征的输入是一帧一帧放入，还是展成一维放入？还有就是您的代码中输入层7774为什么这样定义？是最长一段语音维度*帧长的结果吗？，其余的补零

kersaSoftmax/dnnTrain.py测试问题

1

comment

您好，我对您的程序kersaSoftmax/dnnTrain.py采用aishell数据集进行了训练，但是发现200个batch之后训练集上的识别率还为6%左右，分析了一边代码也不知道是哪里出了问题。。。请问有什么改正措施吗？

kerasSoftmax/gruTrain

4

comment

1. getTestBW里面使用的是wavPath和wavLabel做validation

About

基于dVector的说话人识别keras

89

Stars

31

Forks

Watchers

Owner

← Metadata

89

Stars

31

Forks

Watchers

Owner

Metadata

基于dVector的说话人识别keras