yanzhuangzhuang-beep

Results 21 comments of yanzhuangzhuang-beep

您好我用的标贝的数据集配置文件格式按照AISHELL 使用标贝提供的interval 使用的AISHELL 提供的词汇库 缺少和标贝一致的 儿化音词汇库 我把它添加在pinyin.py 我的代码可以train 但是 在第五代出现nan 断裂 我不知道为啥会出现这样的 情况 请问你在用标贝和该FastSpeech2 结合过程中是如何处理的 谢谢

我的标贝数据没有跑通,在get_align 代码中 我师兄说标贝数据不是整形数据存储的格式 所以所以max_value=32768 不正确 max_value=1(浮点型数据) 在处理后的raw_data .wav文件声音存在 说明此步骤执行没有出错 标贝本身的采样率是22050并不是48000请注意 如果有人愿意分享BiaoBei MFA后的结果我可以试试 因为·我的MFA train_and_align 出现错误 实验停滞

@Tian14267 我使用了你提供的标贝textGrid 得到的结果和你的一样 遇到标点符号出现问题 感知出错 你的MFA是如何得到的 为什么里面没有停顿(下面是我测试的结果) [Biaobei.zip](https://github.com/ming024/FastSpeech2/files/7690344/Biaobei.zip)

@Tian14267 下面是我AISHELL3得到的结果 [AISHELL3.zip](https://github.com/ming024/FastSpeech2/files/7690909/AISHELL3.zip) 测试“哈尔滨天气晴”这句话 经过多个epoch 可以发音大多中文 但是数字”二“不可以所以在那里出错 综上我推断你出现的问题后半句发音差 一方面是你的textgrid没有停顿 另一方面 是你训练的epoch不够多 如果我有好的实验结果会在此通知你 但是数字在发音数据集中占比本身比较少 所以请你换其他中文测试更合适

@yileld 请问您的BiaoBei在长数据的语音合成表现如何 比如“春眠不觉晓,处处闻啼鸟,夜来风雨声,花落知多少。”20字左右的长句子

谢谢您的回答 请问如何使用MFA 才会得到带有sp的对齐文件 我使用 @Tian14267 的textgrid 训练和 我自己MFA的textgrid 其中都不包含sp 导致推理中遇到标点符号记录为sp 无反应 。 我将推理中遇到标点符号注释为sp注释 然后语音合成效果有所好转但是 没有sp肯定会影响节奏之类的 。 如果您能提供·textgrid 或者提供如何使用mfa 会带有sp的数据 非常感谢您一路的指导意见

> > 谢谢您的回答 请问如何使用MFA 才会得到带有sp的对齐文件 我使用 @Tian14267 的textgrid 训练和 我自己MFA的textgrid 其中都不包含sp 导致推理中遇到标点符号记录为sp 无反应 。 我将推理中遇到标点符号注释为sp注释 然后语音合成效果有所好转但是 没有sp肯定会影响节奏之类的 。 如果您能提供·textgrid 或者提供如何使用mfa 会带有sp的数据 非常感谢您一路的指导意见 > > [TextGrid.zip](https://github.com/ming024/FastSpeech2/files/7701757/TextGrid.zip) > > 我也只是个猜想的原因,并不是很确定,这是我的textgrid @yileld 感谢您的textgrid...

hello I have the same problem I use biaobei PhoneLabeling/0000X.interval change it as 0000X.TextGrid Then I run train.py show a problem x = x + pitch_embedding RuntimeError: The size of...

> > hello I have the same problem I use biaobei PhoneLabeling/0000X.interval change it as 0000X.TextGrid Then I run train.py show a problem x = x + pitch_embedding RuntimeError: The...