ChangThinkTech comments

Results 18 comments of


                                            ChangThinkTech

Fix some typos in html and *.md.

这是来自QQ邮箱的自动回复邮件。您好，您的邮件我已经收到了，我会尽快给您回复。

@qiuqiangkong @yongxuUSTC 感谢您的回复，还有个问题。 1.在训练时候，比如连续输入7帧，其对应的y标签是，中间那一帧的特征么？如果是中间那一帧，那么为什么在代码中是 n_concat - 1而不是加1呢？ Cut target spectrogram and take the center frame of each 3D segment. speech_x_3d = mat_2d_to_3d(speech_x, agg_num=n_concat, hop=n_hop) y = speech_x_3d[:, (n_concat - 1)...

关于数据预处理

@qiuqiangkong 感谢您的回复，不好意思，我遇到了一个问题用stoi方法评估语音质量时，干净语言和增强语言的长度不一样，这个时候应该怎么处理呢？感谢！

关于数据预处理

@qiuqiangkong @yongxuUSTC 感谢您的回复我还遇到了一个问题，在使用自己的数据集训练时候，因为noise和speech的长度不一样，不能加在一块。但是prepare_data的calculate_mixture_features()方法，里明明存在处理长度不一样的代码。为什么还会遇到这个问题呢？

关于数据预处理

@qiuqiangkong 您好，麻烦在请问一下，data_generator.py这个文件的作用是？我看了几遍代码并不理解这段代码的作用 while True: if (self._type_ == 'test') and (self._te_max_iter_ is not None): if iter == self._te_max_iter_: break iter += 1 if pointer >= n_samples: epoch += 1 if (self._type_)...

关于数据预处理

@qiuqiangkong 感谢您的回复，其实我问您刚才那个问题的原因是，我在使用自己的数据集实验的时候，发现了 tr_x.shape[0] < te_x.shape[0]这种情况，怀疑可能是generator的原因，现在看来不是因为generator，您大概能知道这可能是什么原因么？不胜感激！

关于数据预处理

@qiuqiangkong 您好，1.那tr_x.shape[0]和te_x.shape[0]代表的意义是指总共有多少条语音呢？还是指输入的语音总共有多少帧特征？如果是指输入语音的条数，那么为什么使用mini_data的时候，tr_x.shape[0]和te_x.shape[0]分别是1392和566呢？ 2.关于原因可能是未使用全部训练数据。这个调整我是应该在哪里调呢？同样的一份代码，我使用mini_data时候tr_x.shape[0]是大于te_x.shape[0]的，而使用自己数据的时候，是小于的（训练集的语音数量是比测试集语音数量要多的）期待您的回复，不胜感激！

关于数据预处理

@qiuqiangkong 您好，tr_x.shape是（295250，7,257）te_x.shape是（336405,7,257,），在mixture_csv的文件里，train的记录是6001条，test的记录是1651条。期待您的回复，不胜感激！

ChangThinkTech

这里是否说明一下

请问笔记有英文版本的吗

Fix some typos in html and *.md.

关于数据预处理

关于数据预处理

关于数据预处理

关于数据预处理

关于数据预处理

关于数据预处理

关于数据预处理