MockingBird
MockingBird copied to clipboard
想要支持更多数据集?在这里提建议
已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持
朋友,你是怎么跑起来的,我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了,这个datasets_root是指什么呢?
假如你下载的 aidatatang_200zh文件放在D盘,train文件路径为 D:\data\aidatatang_200zh\corpus\train
, 你的datasets_root
就是 D:\data\
推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\
而不是D:\data\aidatatang_200zh\corpus\train
推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是
D:\data\
而不是D:\data\aidatatang_200zh\corpus\train
是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。
推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是
D:\data\
而不是D:\data\aidatatang_200zh\corpus\train
是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。
那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗
推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是
D:\data\
而不是D:\data\aidatatang_200zh\corpus\train
是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。
那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗
程序逻辑还没实现 囧 目前我是手动分开跑
已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持
推薦標貝數據集
已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持
aishell3 和 Mozilla Common Voice 数据集
aidatatang_200zh在哪里下载呢
aidatatang_200zh在哪里下载呢
這裡 http://www.openslr.org/62/
aidatatang_200zh在哪里下载呢
這裡 http://www.openslr.org/62/
谢谢
已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持
aishell3 和 Mozilla Common Voice 数据集
https://github.com/babysor/Realtime-Voice-Clone-Chinese/issues/59 已支持aishell3,不过训练效果没增强
大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎
大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎
已经不再需要下载了
大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎
已经不再需要下载了
好的,謝謝大佬的回覆,另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice
請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 https://github.com/CorentinJ/Real-Time-Voice-Cloning/issues/819
檔案結構大致如圖
其中
clips
資料夾內容包含各項 xxx.mp3
希望日後能支持,謝謝
老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么
老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么
- 录制的话,建议是5-10秒长度的大于等于16khz的音频,每个语音单一说话人,尽可能多的覆盖男女生、不同声色(不要单独分开训练,混一起效果好)。预处理的话也就是把音频去噪,切割满足上面这个需求。
- 你指下载下来的数据集吗?
- 私信的话,可以走邮件,或者扫这里的二维码: > >
你的群二维码过期了,可以给个微信么,有一些细节还是想请教
On Mon, 6 Sept 2021 at 01:54, Vega @.***> wrote:
老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么
录制的话,建议是5-10秒长度的大于等于16khz的音频,每个语音单一说话人,尽可能多的覆盖男女生、不同声色(不要单独分开训练,混一起效果好)。预处理的话也就是把音频去噪,切割满足上面这个需求。 2. 你指下载下来的数据集吗? 3. 私信的话,可以走邮件,或者扫这里的二维码: > > [image: WechatIMG54] https://user-images.githubusercontent.com/7423248/130546423-5588bc46-af02-4eda-a122-f64d8f4b7627.jpeg
— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/babysor/MockingBird/issues/10#issuecomment-913363163, or unsubscribe https://github.com/notifications/unsubscribe-auth/ALODQYY2IKTK5WWYPXGOSL3UARJPVANCNFSM5CG2ISUQ . Triage notifications on the go with GitHub Mobile for iOS https://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675 or Android https://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub.
#20 这里有新的二维码
https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子 这边在研究改代码跑跑看 不过都是mp3的很麻烦
https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子 这边在研究改代码跑跑看 不过都是mp3的很麻烦
等你好消息,不过我访问不了
https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子 这边在研究改代码跑跑看 不过都是mp3的很麻烦
等你好消息,不过我访问不了
是指数据集不能访问吗?如果是百度云不能访问的话我这边可以转mega或者GD 链接: https://pan.baidu.com/s/16er-ubcLljayQM7ucd238Q 提取码: dwet
-----------------更新---------------------
访问不了是链接不知怎的最后多了个z,删掉就行了 https://github.com/fighting41love/zhvoice 写了貌似可以直接用于zhrtvc,同一个分支出来的 https://github.com/xingmegshuo/zhrtvc 突然发现上面已经有人推荐过了...
@babysor 二维码过期了,求重发一个~
@Charlottecuc
群满了,加不进去,求作者微信号
老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么
有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制
老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么
有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制
理论可行,可以联系我讨论
老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么
有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制
理论可行,可以联系我讨论
你好 已发到你的gmail里 [email protected] 上面的二维码过期了
新增标贝数据支持BZNSYP MozillaCommonVoice 以上两个数据集支持在最新的主版本中没有看到?难道还没能合并进来吗?