SapphireLab

Results 77 comments of SapphireLab
trafficstars

VITS 中有生成器 Generator 即 `net_g` 和判别器 Discriminator 即 `net_d`, 这两个部分以对抗的方式进行训练. 更多细节可以搜索生成对抗网络 GAN 和 VITS.

这个报错一般是对语音处理时, 判断到数据中存在无穷或者 NaN,即不是所有值都有限。 可能的解决方案: - 一般要检查一下你的语音文件有没有损坏。 - 如果文件很大也可以先切分再做 UVR 这步,也可以定位出哪个语音片段有问题。 - 也可能是 UVR5 代码的问题(毕竟他们仓库下面一大堆这个问题且无明确解决方案),这个需要后续看看能不能复现到。 - 可以使用 UVR5 单独的客户端,可能就正常了。(具体可以参考[文档](https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/xyyqrfwiu3e2bgyk#vffyq))

Em, I believe the command here makes some mistakes because there is no `argparser` written in `mdxnet.py`. will fix it later, and currently you need to use Webui or UVR5...

前面不是写了 `FileNotFoundError(pretrained_s2G)` 么,找不到模型权重,所以需要另外下载一下预训练权重。

> 请教一下,怎么解决呢?去哪里下?目前我的模型都是最新下载的 - 如果是说底模的话,可以到 HuggingFace 下:[HF-Mirror 镜像](https://hf-mirror.com/lj1995/GPT-SoVITS/tree/main), v2 就是 `gsv-v2final-pretrained` 文件夹,下好放在项目内的 `/GPT_SoVITS/pretrained_models` 下。 注意文件结构和 HuggingFace 上的相同,如图 ![image](https://github.com/user-attachments/assets/4b4562f0-9351-44be-b3d3-98735f5ba775) - 如果不会的话直接下载整合包就好。 更详细的可以查看 [整合包及模型下载链接](https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/dkxgpiy9zb96hob4)

G2p 应该没有明显引入 sqlite3, python 是有一个内置模块,但不确定你说的是不是它。 有没有更详细的日志?

> > 下 > > dpo参数在哪里调整呢?调整的方向是啥呢? 微调 GPT 模型时有个 DPO 选项的复选框.

应提供有效的终端信息以定位问题.

`logs/{实验名}/train.log` 是训练 SoVITS 部分的日志 `s2_train.py`. 而在 PR #1422 中 `GPT_SoVITS\utils.py` 的 `get_logger()` 函数日志级别设置为了 `ERROR`,所以一般的 INFO 级别信息不会被保存. 级别: DEBUG < INFO < WARNING < ERROR < CRITICAL 所以如果你需要这部分日志, 1. 将 logger.setLevel...