ChangThinkTech

Results 18 comments of ChangThinkTech

这是来自QQ邮箱的自动回复邮件。您好,您的邮件我已经收到了,我会尽快给您回复。

这是来自QQ邮箱的自动回复邮件。您好,您的邮件我已经收到了,我会尽快给您回复。

这是来自QQ邮箱的自动回复邮件。您好,您的邮件我已经收到了,我会尽快给您回复。

@qiuqiangkong @yongxuUSTC 感谢您的回复,还有个问题。 1.在训练时候,比如连续输入7帧,其对应的y标签是,中间那一帧的特征么?如果是中间那一帧,那么为什么在代码中是 n_concat - 1而不是加1呢? Cut target spectrogram and take the center frame of each 3D segment. speech_x_3d = mat_2d_to_3d(speech_x, agg_num=n_concat, hop=n_hop) y = speech_x_3d[:, (n_concat - 1)...

@qiuqiangkong 感谢您的回复,不好意思,我遇到了一个问题 用stoi方法评估语音质量时,干净语言和增强语言的长度不一样,这个时候应该怎么处理呢? 感谢!

@qiuqiangkong @yongxuUSTC 感谢您的回复 我还遇到了一个问题,在使用自己的数据集训练时候,因为noise和speech的长度不一样,不能加在一块。 但是prepare_data的calculate_mixture_features()方法,里明明存在处理长度不一样的代码。为什么还会遇到这个问题呢?

@qiuqiangkong 您好,麻烦在请问一下,data_generator.py这个文件的作用是?我看了几遍代码并不理解这段代码的作用 while True: if (self._type_ == 'test') and (self._te_max_iter_ is not None): if iter == self._te_max_iter_: break iter += 1 if pointer >= n_samples: epoch += 1 if (self._type_)...

@qiuqiangkong 感谢您的回复,其实我问您刚才那个问题的原因是,我在使用自己的数据集实验的时候,发现了 tr_x.shape[0] < te_x.shape[0]这种情况,怀疑可能是generator的原因,现在看来不是因为generator,您大概能知道这可能是什么原因么?不胜感激!

@qiuqiangkong 您好,1.那tr_x.shape[0]和te_x.shape[0]代表的意义是指总共有多少条语音呢?还是指输入的语音总共有多少帧特征?如果是指输入语音的条数,那么为什么使用mini_data的时候,tr_x.shape[0]和te_x.shape[0]分别是1392和566呢? 2.关于原因可能是未使用全部训练数据。这个调整我是应该在哪里调呢?同样的一份代码,我使用mini_data时候tr_x.shape[0]是大于te_x.shape[0]的,而使用自己数据的时候,是小于的(训练集的语音数量是比测试集语音数量要多的) 期待您的回复,不胜感激!

@qiuqiangkong 您好,tr_x.shape是(295250,7,257)te_x.shape是(336405,7,257,),在mixture_csv的文件里,train的记录是6001条,test的记录是1651条。 期待您的回复,不胜感激!