wespeaker 如何训练一个说话人日志模型

如何训练一个说话人日志模型，我看只有一个预训练模型；还有训练的话对数据的要求是什么

Sep 23 '24 05:09 wwbnjsace

你好，目前给出的是传统的框架：声纹模型提取embedding+聚类的方式，所以只需要一个预训练好的声纹模型即可，要训练的话也是重新finetune一下声纹模型即可，聚类算法不用改变。

Sep 23 '24 11:09 JiJiJiang

你好，目前给出的是传统的框架：声纹模型提取embedding+聚类的方式，所以只需要一个预训练好的声纹模型即可，要训练的话也是重新finetune一下声纹模型即可，聚类算法不用改变。

你好呀，做微调说话人日志微调我有几个问题： 1、我看只有bin/train.py训练代码，没有微调代码，怎么微调呢？ 2、使用example/voxceleb/v2的例子可以吧？ 3、做说话人日志模型微调数据准备和example/voxceleb/v2的例子的数据准备是一致的吧？

Sep 26 '24 11:09 wwbnjsace

追问，您好，说话人日志模型，20人，每人大概需要多少语料（1000条/人）？能看到明显的效果区分效果，实际应用中的语音时长多长最好（2s-5s）?

Dec 18 '24 02:12 FreedomLiX

追问，您好。两种范式：①把CNC的数据集和自己若干人的数据集，合并在一起进行训练。CNC的作为陌生人。②只训练自己的数据集。两种范式，分别采用“新的人”数据作为陌生人进行测试。请问，作者有做过类似的工作没？哪种在陌生人上表现效果好？

Dec 18 '24 02:12 FreedomLiX