ChasonJiang comments

Results 44 comments of


                                            ChasonJiang

【Intel 9560AC】睡眠正常，蓝牙可使用但不可airdrop，不可随航

大佬，为啥我合盖睡眠后唤醒还是黑屏呢？i5 1080p的

【Fast inference 分支】有关于切分句子单句过长会出现问题，并且增加了一种新的切分方法

> fast_inference分支的推理部分，我测试使用标点切分的效果会比“四句一切的效果差”，是不是切分的句子太短效果也不好啊 fast_inference分支，因为padding的原因，如果在一个batch中，句子长度差异很大的话，就会复读的情况。

0306版本GPT-SoVITS客户端推理多文本情况出现间接性复读参考文本内容的问题

> 同样使用三月七模型测试，新分支100%复读参考音频，0217和0306fix版有较小概率复读，0306版100%复读参考音频。0306fix版应该没问题了。不过模型本身确实复读概率有点大。参考音频：6秒，正常说话合成文本：本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责.如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录LICENSE. 切分方式：按英文句号.切我使用了pretrained模型，使用莫娜的一段语音作为参考音频，其他参数一样，测试了10次，新分支并没有100%复现，甚至没有复读

0306版本GPT-SoVITS客户端推理多文本情况出现间接性复读参考文本内容的问题

> > 同样使用三月七模型测试，新分支100%复读参考音频，0217和0306fix版有较小概率复读，0306版100%复读参考音频。0306fix版应该没问题了。不过模型本身确实复读概率有点大。参考音频：6秒，正常说话合成文本：本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责.如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录LICENSE. 切分方式：按英文句号.切 > > 我使用了pretrained模型，使用莫娜的一段语音作为参考音频，其他参数一样，测试了10次，新分支并没有100%复现，甚至没有复读随后，我使用了新分支训练的莫娜模型，其他参数一样，新分支并100%出现复读

0306版本GPT-SoVITS客户端推理多文本情况出现间接性复读参考文本内容的问题

> > > 同样使用三月七模型测试，新分支100%复读参考音频，0217和0306fix版有较小概率复读，0306版100%复读参考音频。0306fix版应该没问题了。不过模型本身确实复读概率有点大。参考音频：6秒，正常说话合成文本：本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责.如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录LICENSE. 切分方式：按英文句号.切 > > > > > > 我使用了pretrained模型，使用莫娜的一段语音作为参考音频，其他参数一样，测试了10次，新分支并没有100%复现，甚至没有复读 > > 随后，我使用了新分支训练的莫娜模型，其他参数一样，新分支并100%出现复读再次，我使用了新分支训练的莫娜模型，其他参数一样，在0306fix中也出现了100%复读。值得注意的是，“新分支”是指3.13的版本，并且我同时测试带dpo和不带dpo。稍后我将用最新分支重新训练测试。

0306版本GPT-SoVITS客户端推理多文本情况出现间接性复读参考文本内容的问题

> 有点乱，有人来整理个时间线和复读情况表么，什么测试参数，什么版本我在重新的严谨测试。我先在每个版本上训练相同数据的模型，然后再交叉测试

0306版本GPT-SoVITS客户端推理多文本情况出现间接性复读参考文本内容的问题

@RVC-Boss 来看看实验结果吧 # 实验记录 ### 目的 - 评估不同版本之间是否存在“间接性复读参考文本内容”和”复读合成文本“的问题。如果存在，就尝试量化问题存在的随机性。 - 问题1：间接性复读参考文本内容 - 问题2：复读合成文本 ### 设置 - 实验将在0217、0306fix、0314这三个版本中，使用相同的数据集进行微调，并采用该版本的默认训练参数，不做任何改动。 - 使用三组不同的参考文本、参考音频、合成文本、推理设置，在上述三个版本训练的模型和三个版本之间做交叉测试，并用pretained模型作为对照。 - 每组实验均采用相同的推理参数：中文，凑50字一切，batch_size=1,top_k=5, top_p=1, temperature=1 - 由于无法确定样本生成的随机性，每个实验抽取5个样本作人耳主观评估。 - 注意：v0127（版本）中，”按标点切“存在报错问题，故均改为”凑50字一切“。v0314源自[[fast inference] 推理功能增强和改进 by...