如何训练一个说话人日志模型
如何训练一个说话人日志模型,我看只有一个预训练模型;还有训练的话对数据的要求是什么
你好,目前给出的是传统的框架:声纹模型提取embedding+聚类的方式,所以只需要一个预训练好的声纹模型即可,要训练的话也是重新finetune一下声纹模型即可,聚类算法不用改变。
你好,目前给出的是传统的框架:声纹模型提取embedding+聚类的方式,所以只需要一个预训练好的声纹模型即可,要训练的话也是重新finetune一下声纹模型即可,聚类算法不用改变。
你好呀,做微调说话人日志微调我有几个问题: 1、我看只有bin/train.py训练代码,没有微调代码,怎么微调呢? 2、使用example/voxceleb/v2的例子可以吧? 3、做说话人日志模型微调数据准备和example/voxceleb/v2的例子的数据准备是一致的吧?
追问,您好,说话人日志模型,20人,每人大概需要多少语料(1000条/人)?能看到明显的效果区分效果,实际应用中的语音时长多长最好(2s-5s)?
追问,您好。两种范式:①把CNC的数据集 和自己若干人的数据集,合并在一起进行训练。CNC的作为陌生人。②只训练自己的数据集。两种范式,分别采用“新的人”数据作为陌生人进行测试。请问,作者有做过类似的工作没?哪种在陌生人上表现效果好?