MockingBird icon indicating copy to clipboard operation
MockingBird copied to clipboard

🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time

Results 302 MockingBird issues
Sort by recently updated
recently updated
newest added

**Summary[问题简述(一句话)]** 原文件似乎是为linux环境创建的,没有说明如何在windows下修改地址,请教一下如何在windows下修改ppg2mel.yaml文件里的地址,有好多文件我并没有在预处理后文件夹中找到 **Env & To Reproduce[复现与环境]** 环境:windows11,anaconda:python3.9.12 数据集文件夹:C:\test\test8\aidatatang_200zh ![屏幕截图 2022-07-31 151052](https://user-images.githubusercontent.com/108673569/182014536-ab0d0665-f331-4af5-95fe-8c4595efd60a.png) 预处理生成文件夹:C:\test\test8\PPGVC\ppg2mel ![屏幕截图 2022-07-31 151313](https://user-images.githubusercontent.com/108673569/182014557-a3ba2af1-1703-4c5e-80b8-755ff68dfbf1.png) 我只能在预训练生成文件夹里找到原文件4,5,6行的同名的文件,这么修改对不对?剩下的7-14行怎么修改? ![屏幕截图 2022-07-31 151607](https://user-images.githubusercontent.com/108673569/182014725-1b14040c-6570-4127-b22e-38ff9ce1da1d.png) **Screenshots[截图(如有)]** ![屏幕截图 2022-07-31 145656](https://user-images.githubusercontent.com/108673569/182014084-91e45b39-ae5d-4509-9743-761755ff38b1.png) 直接运行报错 ![屏幕截图 2022-07-31 145924](https://user-images.githubusercontent.com/108673569/182014141-c593d5ff-1c25-44d7-bdbf-d49057435b52.png)

北京超算云预处理pre.py出错 ![image](https://user-images.githubusercontent.com/109330558/182010051-7d46b11a-4960-4e7e-8c1e-96fd7c69b90a.png)

![Snipaste_2022-07-29_00-20-31](https://user-images.githubusercontent.com/110005064/181588389-e010fc4a-9509-4558-b061-5b13177e8e6d.png) 我在pypi上搜不到这个模块只找到这个 ![image](https://user-images.githubusercontent.com/110005064/181588680-4aeaa332-21db-42cd-8755-1162f84aca4d.png)

目前只跑了7k,素材都是自己精心挑选和处理的,但是attention图始终无法呈现明显斜线,是素材的问题还是训练数没够?有没有必要等等看 ![image](https://user-images.githubusercontent.com/80482907/181198128-5652af12-31fb-489d-9434-cd08e97a3b09.png)

大佬们,我按照作者的步骤安装好后,为什么打开的时候报错?报错代码: 系统:Windows11 Torch选的CPU版本

![image](https://user-images.githubusercontent.com/110005064/181652077-835c328d-fb7a-4777-8290-289bfe573fa2.png) 从cuda11.6降到cuda11.3还是不可以 ![image](https://user-images.githubusercontent.com/110005064/181652218-c3a9f156-a388-4c9b-9408-973b196adebc.png)

**Summary[问题简述(一句话)]** A clear and concise description of what the issue is. 运行pip install -r requirements.txt 来安装剩余的必要包时出错 **Env & To Reproduce[复现与环境]** 描述你用的环境、代码版本、模型、 **Screenshots[截图(如有)]** If applicable, add screenshots to help ![~3@{I3@IT%BOVDRZ2)E%1I9](https://user-images.githubusercontent.com/105853222/169274037-297fea56-6f5b-46b2-879d-42d8ba2c77d5.png) ![16...

Using model: Tacotron Using device: cuda Initialising Tacotron Model... \Loading the json with %s {'sample_rate': 16000, 'n_fft': 800, 'num_mels': 80, 'hop_size': 200, 'win_size': 800, 'fmin': 55, 'min_level_db': -100, 'ref_level_db': 20,...

[AyahaShirane](https://github.com/AyahaShirane) 专项训练参照这个视频MockingBird数据集制作教程-手把手教你克隆海子姐的声线_哔哩哔哩_bilibili 实测在已有模型基础上训练20K左右就能改变成想要的语音语调了。你如果是想要泛用型台湾口音的话,就尽可能收集更多人的数据集,否则会偏向特定某一个人的口音,而且断句和停顿似乎也会受到新数据集的影响 Reference: #380 > 作者却苦于近期精力限制只能势单力薄处理一些小的bug,也看到issue区有不少爱好与开发者想要学习或二次改造更好满足自己需求,不过比较零碎难以展开。为了让项目和AI持续可以给大家提供更多价值,共同学习,我在issue区根据不同主题创建长期交流频道,若留言人数超过20也将建立对应交流群。 > - 如何改参数,搞出更逼真的克隆效果 435 > - 如何改模型,搞出更好效果 436 > - 训练克隆特定人声音&finetune 437 > - 学术/论文讨论/训练分析 438 > - 跨语言支持 440 > - 工程化/新场景讨论(绝不做恶...

discussion

File "C:\Users\tes223\AppData\Local\Programs\Python\Python37\lib\site-packages\torch\optim\adam.py", line 255, in _single_tensor_adam assert not step_t.is_cuda, "If capturable=False, state_steps should not be CUDA tensors." AssertionError: If capturable=False, state_steps should not be CUDA tensors. 请问如何解决?