ChasonJiang

Results 44 comments of ChasonJiang

大佬,为啥我合盖睡眠后唤醒还是黑屏呢?i5 1080p的

> fast_inference分支的推理部分,我测试使用标点切分的效果会比“四句一切的效果差”,是不是切分的句子太短效果也不好啊 fast_inference分支,因为padding的原因,如果在一个batch中,句子长度差异很大的话,就会复读的情况。

> 同样使用三月七模型测试,新分支100%复读参考音频,0217和0306fix版有较小概率复读,0306版100%复读参考音频。0306fix版应该没问题了。不过模型本身确实复读概率有点大。 参考音频:6秒,正常说话 合成文本:本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责.如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录LICENSE. 切分方式:按英文句号.切 我使用了pretrained模型,使用莫娜的一段语音作为参考音频,其他参数一样,测试了10次,新分支并没有100%复现,甚至没有复读

> > 同样使用三月七模型测试,新分支100%复读参考音频,0217和0306fix版有较小概率复读,0306版100%复读参考音频。0306fix版应该没问题了。不过模型本身确实复读概率有点大。 参考音频:6秒,正常说话 合成文本:本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责.如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录LICENSE. 切分方式:按英文句号.切 > > 我使用了pretrained模型,使用莫娜的一段语音作为参考音频,其他参数一样,测试了10次,新分支并没有100%复现,甚至没有复读 随后,我使用了新分支训练的莫娜模型,其他参数一样,新分支并100%出现复读

> > > 同样使用三月七模型测试,新分支100%复读参考音频,0217和0306fix版有较小概率复读,0306版100%复读参考音频。0306fix版应该没问题了。不过模型本身确实复读概率有点大。 参考音频:6秒,正常说话 合成文本:本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责.如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录LICENSE. 切分方式:按英文句号.切 > > > > > > 我使用了pretrained模型,使用莫娜的一段语音作为参考音频,其他参数一样,测试了10次,新分支并没有100%复现,甚至没有复读 > > 随后,我使用了新分支训练的莫娜模型,其他参数一样,新分支并100%出现复读 再次,我使用了新分支训练的莫娜模型,其他参数一样,在0306fix中也出现了100%复读。值得注意的是,“新分支”是指3.13的版本,并且我同时测试带dpo和不带dpo。稍后我将用最新分支重新训练测试。

> 有点乱,有人来整理个时间线和复读情况表么,什么测试参数,什么版本 我在重新的严谨测试。我先在每个版本上训练相同数据的模型,然后再交叉测试

@RVC-Boss 来看看实验结果吧 # 实验记录 ### 目的 - 评估不同版本之间是否存在“间接性复读参考文本内容”和”复读合成文本“的问题。如果存在,就尝试量化问题存在的随机性。 - 问题1:间接性复读参考文本内容 - 问题2:复读合成文本 ### 设置 - 实验将在0217、0306fix、0314这三个版本中,使用相同的数据集进行微调,并采用该版本的默认训练参数,不做任何改动。 - 使用三组不同的参考文本、参考音频、合成文本、推理设置,在上述三个版本训练的模型和三个版本之间做交叉测试,并用pretained模型作为对照。 - 每组实验均采用相同的推理参数:中文,凑50字一切,batch_size=1,top_k=5, top_p=1, temperature=1 - 由于无法确定样本生成的随机性,每个实验抽取5个样本作人耳主观评估。 - 注意:v0127(版本) 中,”按标点切“存在报错问题,故均改为”凑50字一切“。v0314源自[[fast inference] 推理功能增强和改进 by...

> 补充一个刚发现的新问题,长文本的情况下,推理出来的音频会有小概率出现吞字问题。 我上实验过程中也发现了,但是所有版本均存在,和参考文本(音频)和合成文本的内容是有关的

有意思的是,当参考文本中有”…“,且有重复文本时,有大概率复读或吞字

> 训练部分对比baseline有做什么改动吗,0306fix和0314 我维护的那个分支应该是没有做改动的,不过在最后一个commit中我merge了main分支。所以实际相较于0217,我并不知道训练代码有没有改动