watchtower

Results 5 comments of watchtower

@Arcgurus 是否对GPT进行了重新训练,如果进行了,请尝试将最新代码中的将DPO选项关闭后再次训练,检查问题是否依然存在。

@Arcgurus 嗯嗯,因为日文引号与中文有区别,这可能会成为影响,后续应该会进行修复。或使用多语言混合进行推理。

@Arcgurus 是这个LangSegment造成,这个会使用词表做分词,所以有这个就会有问题,这种语言冲突比较难以根除,所以建议:使用多语言混合,或者手动将内容调整为纯净的单语言,或版本回退。 这个可能需要与RVC-Boss联系。 ['ある“', '予言”', 'の中だけに登場する伝説上の聖騎士。'] ['ja', 'zh', 'ja'] LangSegment的分割结果

@Arcgurus 我详细的看了LangSegment的代码,这个工具的分词十分的简单粗暴,如果没有事先设置的标记,就会按照语言编码特点与标点进行切分,甚至没用分词工具,之前提到的NLTK和这个没关系(抱歉造成误解)。然后识别语言,所以会有这个问题。

@Arcgurus #509 给出的一些方案,最好是用相应的语言tag进行区分,但是这意味着要用户自己负责输入内容的可用性,事实上GPT会根据上下文自行调整音素的生成,所以建议添加一个是否进行语言筛选的选项,或者将seg的结果暴露到前端,供调整 @RVC-Boss