hkzbiyx
hkzbiyx
@yangyi-hup 可能是背景噪声的问题,这个模型会尝试保留音乐、环境噪声等声音。要干净没杂音的声音才能生成的比较好。可以分享一下你用来生成的音频让我测试一下看看问题在哪。
https://github.com/Plachtaa/VALL-E-X/issues/132
> > #132 > > 谢谢,尝试了几种方法,还是有错误。但是错误行数不一样了。`AttributeError Traceback (most recent call last) [/content/VALL-E-X/app.py](https://bs552ezinfg-496ff2e9c6d22116-0-colab.googleusercontent.com/outputframe.html?vrz=colab_20231201-060200_RC00_586950161#) in 333 334 --> 335 from utils.sentence_cutter import split_text_into_sentences 336 @torch.no_grad() 337 def infer_long_text(text, preset_prompt, prompt=None, language='auto', accent='no-accent'):...
@ccjackcong 试一下把gradio版本重装为3.41.2,numpy版本重装为1.24.4或许可以解决问题。在我电脑上的环境是这样的。 ``` pip install numpy==1.24.4 pip install gradio==3.41.2 ```
> 刚做了测试了,还是不行。因该还是依赖有冲突,但是好像很多,一时间不知道怎么下手。 > > ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts....
> > @ccjackcong 试一下把gradio版本重装为3.41.2,numpy版本重装为1.24.4或许可以解决问题。在我电脑上的环境是这样的。 > > ``` > > pip install numpy==1.24.4 > > pip install gradio==3.41.2 > > ``` > > 先谢谢您,我找时间跑一遍再。另外,想请教您,mac下,有能训练的模型吗?我想试试本地,但我win电脑的显卡不行,所以像试试mac下。 就我所知应该没单独给mac的模型,我不太清楚这一块,你可以试试转译啥的能不能用。你win的显卡如果有6gb的显存应该就可以用了。如果显存不够应该可以换个小的whisper模型用,不过比较折腾,得新下个模型,然后修改对应加载的代码。理论上单语音生成的部分应该对显卡要求不高,不过我不是写核心部分的,不太清楚对显卡要求有多低。
> > @ccjackcong 试一下把gradio版本重装为3.41.2,numpy版本重装为1.24.4或许可以解决问题。在我电脑上的环境是这样的。 > > ``` > > pip install numpy==1.24.4 > > pip install gradio==3.41.2 > > ``` > > 刚做了测试了,还是不行。因该还是依赖有冲突,但是好像很多,一时间不知道怎么下手。 > > ERROR: pip's dependency resolver does...
Download this file. https://pan.baidu.com/s/123sbEQRvbWJrx728JwgqSg?pwd=h2gi If you're on Linux, run this: tar zxvf vocos.tar.gz -C ~/.cache/huggingface/hub If you're on Windows, please unzip the file to this directory: C:\Users\%username%\.cache\huggingface\hub\models--charactr--vocos-encodec-24khz\
Download this file. https://pan.baidu.com/s/123sbEQRvbWJrx728JwgqSg?pwd=h2gi If you're on Linux, run this: tar zxvf vocos.tar.gz -C ~/.cache/huggingface/hub If you're on Windows, please unzip the file to this directory: C:\Users\%username%\.cache\huggingface\hub\models--charactr--vocos-encodec-24khz\
@zzf-yy Download this file. https://pan.baidu.com/s/123sbEQRvbWJrx728JwgqSg?pwd=h2gi If you're on Linux, run this: `tar zxvf vocos.tar.gz -C ~/.cache/huggingface/hub` If you're on Windows, please unzip the file to this directory: `C:\Users\%username%\.cache\huggingface\hub\models--charactr--vocos-encodec-24khz\`