MockingBird 想要支持更多数据集？在这里提建议

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68) 需要更多请在这里提建议，并+1投票，将为大家补充支持

Aug 16 '21 02:08 babysor

朋友，你是怎么跑起来的，我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了，这个datasets_root是指什么呢？

Aug 16 '21 02:08 yfq512

假如你下载的 aidatatang_200zh文件放在D盘，train文件路径为 D:\data\aidatatang_200zh\corpus\train , 你的datasets_root就是 D:\data\

Aug 16 '21 03:08 babysor

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

Aug 17 '21 09:08 hertz-pj

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

Aug 17 '21 09:08 babysor

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

Aug 17 '21 11:08 hertz-pj

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

程序逻辑还没实现囧目前我是手动分开跑

Aug 17 '21 11:08 babysor

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68) 需要更多请在这里提建议，并+1投票，将为大家补充支持

推薦標貝數據集

Aug 17 '21 13:08 XiuChen-Liu

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68) 需要更多请在这里提建议，并+1投票，将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

Aug 23 '21 08:08 0we

aidatatang_200zh在哪里下载呢

Aug 27 '21 15:08 loilih

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

Aug 27 '21 15:08 XiuChen-Liu

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

谢谢

Aug 27 '21 16:08 loilih

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68) 需要更多请在这里提建议，并+1投票，将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

https://github.com/babysor/Realtime-Voice-Clone-Chinese/issues/59 已支持aishell3，不过训练效果没增强

Aug 28 '21 00:08 babysor

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

Aug 28 '21 05:08 XiuChen-Liu

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

Aug 28 '21 06:08 babysor

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

好的，謝謝大佬的回覆，另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice

Aug 28 '21 06:08 XiuChen-Liu

請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 https://github.com/CorentinJ/Real-Time-Voice-Cloning/issues/819 檔案結構大致如圖其中 clips 資料夾內容包含各項 xxx.mp3 希望日後能支持，謝謝

Sep 02 '21 12:09 FawenYo

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

Sep 05 '21 03:09 Zhiqing-Xu

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

录制的话，建议是5-10秒长度的大于等于16khz的音频，每个语音单一说话人，尽可能多的覆盖男女生、不同声色（不要单独分开训练，混一起效果好）。预处理的话也就是把音频去噪，切割满足上面这个需求。
你指下载下来的数据集吗？
私信的话，可以走邮件，或者扫这里的二维码： > >

Sep 06 '21 05:09 babysor

你的群二维码过期了，可以给个微信么，有一些细节还是想请教

On Mon, 6 Sept 2021 at 01:54, Vega @.***> wrote:

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

录制的话，建议是5-10秒长度的大于等于16khz的音频，每个语音单一说话人，尽可能多的覆盖男女生、不同声色（不要单独分开训练，混一起效果好）。预处理的话也就是把音频去噪，切割满足上面这个需求。 2. 你指下载下来的数据集吗？ 3. 私信的话，可以走邮件，或者扫这里的二维码： > > [image: WechatIMG54] https://user-images.githubusercontent.com/7423248/130546423-5588bc46-af02-4eda-a122-f64d8f4b7627.jpeg

— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/babysor/MockingBird/issues/10#issuecomment-913363163, or unsubscribe https://github.com/notifications/unsubscribe-auth/ALODQYY2IKTK5WWYPXGOSL3UARJPVANCNFSM5CG2ISUQ . Triage notifications on the go with GitHub Mobile for iOS https://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675 or Android https://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub.

Sep 06 '21 14:09 Zhiqing-Xu

#20 这里有新的二维码

Sep 07 '21 01:09 babysor

https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子这边在研究改代码跑跑看不过都是mp3的很麻烦

Sep 26 '21 15:09 ShouNichi

https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子这边在研究改代码跑跑看不过都是mp3的很麻烦

等你好消息，不过我访问不了

Sep 26 '21 15:09 babysor

https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子这边在研究改代码跑跑看不过都是mp3的很麻烦

等你好消息，不过我访问不了

是指数据集不能访问吗？如果是百度云不能访问的话我这边可以转mega或者GD 链接: https://pan.baidu.com/s/16er-ubcLljayQM7ucd238Q 提取码: dwet

-----------------更新---------------------

访问不了是链接不知怎的最后多了个z，删掉就行了 https://github.com/fighting41love/zhvoice 写了貌似可以直接用于zhrtvc，同一个分支出来的 https://github.com/xingmegshuo/zhrtvc 突然发现上面已经有人推荐过了...

Sep 27 '21 01:09 ShouNichi

@babysor 二维码过期了，求重发一个～

Sep 27 '21 12:09 Charlottecuc

cb0f71d680c3b7d6c2aca6fce1a220d

@Charlottecuc

Sep 27 '21 13:09 babysor

群满了，加不进去，求作者微信号

Oct 07 '21 09:10 LxKxC

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

Oct 11 '21 04:10 kslz

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

理论可行，可以联系我讨论

Oct 11 '21 05:10 babysor

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

理论可行，可以联系我讨论

你好已发到你的gmail里 [email protected] 上面的二维码过期了

Oct 11 '21 11:10 kslz

新增标贝数据支持BZNSYP MozillaCommonVoice 以上两个数据集支持在最新的主版本中没有看到？难道还没能合并进来吗？

Oct 14 '21 03:10 lcp580

MockingBird MockingBird copied to clipboard

想要支持更多数据集？在这里提建议

MockingBird
MockingBird copied to clipboard