hyli666

Results 3 comments of hyli666

Dear dalao 求回复!

你好! (1)关于噪声信号长度大于语音信号长度:我用的是Noise92的噪声,大概一个信号有3~4分钟,timit语料的语音信号大概一个5s左右,所以在我的数据里肯定是噪声长度更大。这个条件下,我们才能在噪声里随机选取某个片段加在语音里呀。你用的语音信号太长了?如果噪声长度补零到语音长度一样的话,同样的噪声种类每次加的噪声都是一样的了,这是不可以的吧。。。 (2)徐老师论文里是回归到干净信号的lps,只需要干净的LPS就好了。纯noise的lps是为了计算IRM的,当时为了比较纯LPS和IRM哪个效果好所以都保存下来了。NAT就是noise aware training,在论文里有讲。表示每段带噪语音信号开始前几秒的噪声功率谱。

@JH2018-20 ”干净语音用的是NOISE中的clean数据“ 我不知道那是啥数据诶,原论文用的是timit数据,我用的也是