fclx512
fclx512
rt,我是观望了一个月等小版本更新后上手v3的,在寻找消除v3电音方法时突然想到了能重建音频的RVC变声器(不太懂技术原理描述有误还请指正) 试着把GSV的输出用目标音色的RVC过一遍后发现电音和音质被恢复到了v2的水平,而v3的情感音色优势得以保留从而实现全方位提升。研究了一下还有意外之喜↓ GSV和RVC联动能做的事: 1. 抑制电音并修复音质:即使v3的采样给到最低的4在过一遍目标音色的RVC后也能显著抑制电音以及修复音质,大致能恢复到v2的水平 2. 补全角色情绪:利用RVC转换其他角色的平缓音频,为目标角色提供更多音频,解决某些角色只有单一情绪参考的硬伤 3. 改善日转中大佐口音:通过RVC转换中文参考音频,减少纯日语角色读中文时的口音问题,还能作为训练集纠正RVC模型学到的日式中文读法。以演示视频提到的模型为例,原日文参考约160条,再加入60条v2推理的中文音频(因为音质更高)重新训练就可以基本纠正RVC的读音问题 演示视频:https://m.bilibili.com/video/BV1q3ZCYqEFY (技术力一坨还没时间练模型所以演示效果不好,还请以大伙自己测试效果为准,但我可以保证上限一定是远高于视频展示的水平的😢) 最后还有一点比较好奇,刚发现这套流程的时候特意找过了,网上除了我视频中感谢的两位灵感参考外就完全找不到提及到GSV结合RVC的文章或教程了,之前v2的时候转换效果不明显没人发现很正常,v3发布了这么久居然还没有想到这出的吗🤔
如题,因为选中文本框时的边框样式很遮挡视线导致难以对齐文本,且移动小框时极易误触到旋转/拉伸文本框,能否增加一个控制编辑文本框的开关?关闭后文本框边框显示成较窄的蓝边,此时仅可移动文本框,打开后和现有样式一样可正常编辑