GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

为避免复读和泄露,能加个自动审听重抽卡功能吗?

Open AnonymousmousCoder opened this issue 10 months ago • 11 comments

一旦用上自己的GPT底模,复读和泄露问题还是挺常见的。 能内置个自动审听、重新抽卡功能吗? 出现复读、泄露问题的话,应该用训练步数更小的还是大的GPT模型?

AnonymousmousCoder avatar Apr 12 '24 00:04 AnonymousmousCoder

出现重复,泄漏可以尝试换参考,换切分,换GPT

XXXXRT666 avatar Apr 12 '24 00:04 XXXXRT666

有打算自己手搓这种功能,加入自动检查和重新生成纠正生成的问题,尽可能实现自动完成大段无误音频推理。 倒是更期待看到emotional, speech to speech 功能出来

xiding11 avatar Apr 12 '24 01:04 xiding11

有打算自己手搓这种功能,加入自动检查和重新生成纠正生成的问题,尽可能实现自动完成大段无误音频推理。 倒是更期待看到emotional, speech to speech 功能出来

看来现在只能自己手搓了

AnonymousmousCoder avatar Apr 12 '24 03:04 AnonymousmousCoder

我也是出现复读和吞句问题,只有在api调用时候才会出现,在webui没这问题

https://github.com/RVC-Boss/GPT-SoVITS/assets/29749635/18368fb2-f93d-45ce-97d1-ee7bb7335922

https://github.com/RVC-Boss/GPT-SoVITS/assets/29749635/5fe9c3e5-b0e9-432e-8d25-46ea58d93418

worm128 avatar Apr 14 '24 04:04 worm128

我也是出现复读和吞句问题,只有在api调用时候才会出现,在webui没这问题

https://github.com/RVC-Boss/GPT-SoVITS/assets/29749635/18368fb2-f93d-45ce-97d1-ee7bb7335922

https://github.com/RVC-Boss/GPT-SoVITS/assets/29749635/5fe9c3e5-b0e9-432e-8d25-46ea58d93418

建议更新,并切分

XXXXRT666 avatar Apr 14 '24 04:04 XXXXRT666

我也是出现复读和吞句问题,只有在api调用时候才会出现,在webui没这问题

QQ2024414-121331-HD.mp4













QQ2024414-121223-HD.mp4

建议更新,并切分

更新什么?代码是更新最新的,api文件有切分参数吗,没看到有

worm128 avatar Apr 14 '24 04:04 worm128

我也是出现复读和吞句问题,只有在api调用时候才会出现,在webui没这问题

QQ2024414-121331-HD.mp4
QQ2024414-121223-HD.mp4

建议更新,并切分

更新什么?代码是更新最新的,api文件有切分参数吗,没看到有

建议仔细看,可以设置默认或者是请求里传入

XXXXRT666 avatar Apr 14 '24 04:04 XXXXRT666

我也是出现复读和吞句问题,只有在api调用时候才会出现,在webui没这问题

QQ2024414-121331-HD.mp4
QQ2024414-121223-HD.mp4

建议更新,并切分

更新什么?代码是更新最新的,api文件有切分参数吗,没看到有

建议仔细看,可以设置默认或者是请求里传入

看到了,谢谢 ·-cp-文本切分符号设定, 默认为空, 以",.,。"字符串的方式传入`

worm128 avatar Apr 14 '24 04:04 worm128

我也是出现复读和吞句问题,只有在api调用时候才会出现,在webui没这问题

QQ2024414-121331-HD.mp4
QQ2024414-121223-HD.mp4

建议更新,并切分

更新什么?代码是更新最新的,api文件有切分参数吗,没看到有

建议仔细看,可以设置默认或者是请求里传入

已验证使用-cp ",.,。!!??" 切分后,没有出现复读和吞句问题

worm128 avatar Apr 14 '24 04:04 worm128

我觉得一些符号特别容易静音或者复读比如省略号。。。

hyhuc0079 avatar Apr 27 '24 15:04 hyhuc0079

我觉得一些符号特别容易静音或者复读比如省略号。。。

可能是这样,我句子带书名号《》,里面很容易忽略不读

worm128 avatar May 03 '24 14:05 worm128