RAD-NeRF 支持中文语音模型

我们使用的中文语音模型有高达3903个维度，能否修改代码让它支持中文语音呢？如果可以，请问该如何修改呢？

Feb 27 '23 03:02 boolw

直接改asrmodel中相应的维度就可以了

Mar 01 '23 02:03 QinlongHuang

我们试了好几种修改方法但是效果都不好，可以提供一下具体的修改方法吗？非常感谢

Mar 01 '23 02:03 boolw

您说的效果不好是指模型run不起来还是训完结果不太好呢？我也是在hf上随便找了个model, jonatasgrosman/wav2vec2-large-xlsr-53-chinese-zh-cn

Mar 01 '23 10:03 QinlongHuang

我们也是使用的jonatasgrosman/wav2vec2-large-xlsr-53-chinese-zh-cn这个模型，我们尝试改了self.audio_in_dim = 3503 和 self.audio_dim = 3503 两次地方，但是训练出来视频口型和语音不对应，效果不理想，可以提供一下具体修改的方案吗？

Mar 01 '23 11:03 boolw

@boolw 请问这个有什么进展吗？