FAcodec icon indicating copy to clipboard operation
FAcodec copied to clipboard

关于训练的问题。

Open hizening opened this issue 1 year ago • 3 comments

大佬您好,麻烦问下在准备训练和验证数据集时,这两个路径./data/train.txt"和"./data/val.txt"可以只包含音频的路径吗?我的数据集不包含文本转录之类的信息。

hizening avatar Sep 23 '24 11:09 hizening

可以的,不需要文本转录

Plachtaa avatar Sep 23 '24 12:09 Plachtaa

感谢您的解答。我的服务器不能联网,因此我把train.py里需要从huggingface上下载的model下载后放到了服务器上。有以下两个问题想跟您请教一下: 1、不加载https://huggingface.co/Plachta/FAcodec/tree/main 里的预训练模型,我把strict=false,可以进行训练。但会报Wav2Vec2ForCTC模型权重未正确初始化的错误。(nvidia/speakerverification_en_titanet_large可以正常加载) 2、加载https://huggingface.co/Plachta/FAcodec/tree/main 里的预训练模型,进行训练,会同时报Wav2Vec2ForCTC模型权重未正确初始化的错误和KeyError: 'net' 的错误。 ps: 1、这里的两个模型我离线下载到了我的服务器上。 w2v_processor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-xlsr-53-espeak-cv-ft") w2v_model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-xlsr-53-espeak-cv-ft").to(device) w2v_model.eval()

    speaker_model = nemo_asr.models.EncDecSpeakerLabelModel.from_pretrained("nvidia/speakerverification_en_titanet_large")

2、报错如图所示。 image image

hizening avatar Sep 26 '24 12:09 hizening

预训练模型权重仅包含net的部分,自己改一下就行 wav2vec那个报错不用管

Plachtaa avatar Sep 26 '24 13:09 Plachtaa