MockingBird icon indicating copy to clipboard operation
MockingBird copied to clipboard

想要支持更多数据集?在这里提建议

Open babysor opened this issue 3 years ago • 40 comments

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持

babysor avatar Aug 16 '21 02:08 babysor

朋友,你是怎么跑起来的,我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了,这个datasets_root是指什么呢?

yfq512 avatar Aug 16 '21 02:08 yfq512

假如你下载的 aidatatang_200zh文件放在D盘,train文件路径为 D:\data\aidatatang_200zh\corpus\train , 你的datasets_root就是 D:\data\

babysor avatar Aug 16 '21 03:08 babysor

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

hertz-pj avatar Aug 17 '21 09:08 hertz-pj

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

babysor avatar Aug 17 '21 09:08 babysor

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

hertz-pj avatar Aug 17 '21 11:08 hertz-pj

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

程序逻辑还没实现 囧 目前我是手动分开跑

babysor avatar Aug 17 '21 11:08 babysor

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持

推薦標貝數據集

XiuChen-Liu avatar Aug 17 '21 13:08 XiuChen-Liu

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

0we avatar Aug 23 '21 08:08 0we

aidatatang_200zh在哪里下载呢

loilih avatar Aug 27 '21 15:08 loilih

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

XiuChen-Liu avatar Aug 27 '21 15:08 XiuChen-Liu

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

谢谢

loilih avatar Aug 27 '21 16:08 loilih

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68) 需要更多请在这里提建议,并+1投票,将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

https://github.com/babysor/Realtime-Voice-Clone-Chinese/issues/59 已支持aishell3,不过训练效果没增强

babysor avatar Aug 28 '21 00:08 babysor

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

XiuChen-Liu avatar Aug 28 '21 05:08 XiuChen-Liu

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

babysor avatar Aug 28 '21 06:08 babysor

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

好的,謝謝大佬的回覆,另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice

XiuChen-Liu avatar Aug 28 '21 06:08 XiuChen-Liu

請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 https://github.com/CorentinJ/Real-Time-Voice-Cloning/issues/819 檔案結構大致如圖 image 其中 clips 資料夾內容包含各項 xxx.mp3 希望日後能支持,謝謝

FawenYo avatar Sep 02 '21 12:09 FawenYo

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

Zhiqing-Xu avatar Sep 05 '21 03:09 Zhiqing-Xu

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

  1. 录制的话,建议是5-10秒长度的大于等于16khz的音频,每个语音单一说话人,尽可能多的覆盖男女生、不同声色(不要单独分开训练,混一起效果好)。预处理的话也就是把音频去噪,切割满足上面这个需求。
  2. 你指下载下来的数据集吗?
  3. 私信的话,可以走邮件,或者扫这里的二维码: > > WechatIMG54

babysor avatar Sep 06 '21 05:09 babysor

你的群二维码过期了,可以给个微信么,有一些细节还是想请教

On Mon, 6 Sept 2021 at 01:54, Vega @.***> wrote:

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

录制的话,建议是5-10秒长度的大于等于16khz的音频,每个语音单一说话人,尽可能多的覆盖男女生、不同声色(不要单独分开训练,混一起效果好)。预处理的话也就是把音频去噪,切割满足上面这个需求。 2. 你指下载下来的数据集吗? 3. 私信的话,可以走邮件,或者扫这里的二维码: > > [image: WechatIMG54] https://user-images.githubusercontent.com/7423248/130546423-5588bc46-af02-4eda-a122-f64d8f4b7627.jpeg

— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/babysor/MockingBird/issues/10#issuecomment-913363163, or unsubscribe https://github.com/notifications/unsubscribe-auth/ALODQYY2IKTK5WWYPXGOSL3UARJPVANCNFSM5CG2ISUQ . Triage notifications on the go with GitHub Mobile for iOS https://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675 or Android https://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub.

Zhiqing-Xu avatar Sep 06 '21 14:09 Zhiqing-Xu

#20 这里有新的二维码

babysor avatar Sep 07 '21 01:09 babysor

https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子 这边在研究改代码跑跑看 不过都是mp3的很麻烦

ShouNichi avatar Sep 26 '21 15:09 ShouNichi

https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子 这边在研究改代码跑跑看 不过都是mp3的很麻烦

等你好消息,不过我访问不了

babysor avatar Sep 26 '21 15:09 babysor

https://github.com/fighting41love/zhvoicez 这个看着很厉害的样子 这边在研究改代码跑跑看 不过都是mp3的很麻烦

等你好消息,不过我访问不了

是指数据集不能访问吗?如果是百度云不能访问的话我这边可以转mega或者GD 链接: https://pan.baidu.com/s/16er-ubcLljayQM7ucd238Q 提取码: dwet

-----------------更新---------------------

访问不了是链接不知怎的最后多了个z,删掉就行了 https://github.com/fighting41love/zhvoice 写了貌似可以直接用于zhrtvc,同一个分支出来的 https://github.com/xingmegshuo/zhrtvc 突然发现上面已经有人推荐过了...

ShouNichi avatar Sep 27 '21 01:09 ShouNichi

@babysor 二维码过期了,求重发一个~

Charlottecuc avatar Sep 27 '21 12:09 Charlottecuc

cb0f71d680c3b7d6c2aca6fce1a220d

@Charlottecuc

babysor avatar Sep 27 '21 13:09 babysor

群满了,加不进去,求作者微信号

LxKxC avatar Oct 07 '21 09:10 LxKxC

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

kslz avatar Oct 11 '21 04:10 kslz

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

理论可行,可以联系我讨论

babysor avatar Oct 11 '21 05:10 babysor

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

理论可行,可以联系我讨论

你好 已发到你的gmail里 [email protected] 上面的二维码过期了

kslz avatar Oct 11 '21 11:10 kslz

新增标贝数据支持BZNSYP MozillaCommonVoice 以上两个数据集支持在最新的主版本中没有看到?难道还没能合并进来吗?

lcp580 avatar Oct 14 '21 03:10 lcp580