Alison

Results 6 comments of Alison

Hello, Have you solved the problem? I just got this error, my envirnment is torch-1.13.0,python-3.10

能提供50种语言的是sensevoice-large,这个还没有开源,目前开源模型能支持的只有5种语言。可以看一下论文https://arxiv.org/html/2407.04051v2

> 是的,但是需要纯净的数据量,否则会出现类似的问题 #126 我用了20万MB的语料训练,但是还是乱码,除了增加数据量和fine turn,还有什么原因会导致乱码

改用whisper微调方言了 EdwardGgZ ***@***.***> 于2025年6月12日周四 19:58写道: > *EdwardGgZ* left a comment (FunAudioLLM/SenseVoice#225) > > > 你好,请问你训练时运行bash finetune.sh时,++model等参数能传递到train_ds.py中吗,我一直报错 > > image.png (view on web) > > > — > Reply to this...

用zh liuxu999 ***@***.***> 于2025年6月30日周一 16:28写道: > *liuxu999* left a comment (FunAudioLLM/SenseVoice#225) > > > @AlisonDexter > 嗨嗨你好,请问你当时用sensevoice微调新方言语种的时候,怎么设置新方言语种的类型呢,用zh嘛。我目前正在微调闽南语 > > — > Reply to this email directly, view it on GitHub...

我觉得whisper比较好,但是力大飞砖。出现微调四川话后对原有普通话的识别效果下降的情况, whisper支持普通话和粤语,我了解到的有的人会在训练方言会根据片区来训练。 liuxu999 ***@***.***> 于2025年7月3日周四 14:55写道: > *liuxu999* left a comment (FunAudioLLM/SenseVoice#225) > > > @AlisonDexter > 我对sensevoice_small添加了minnan语的token,然后用大概2万条闽南语言训练后,发现指标相较于微调前才增加了4%。请问你微调方言用sensevoice_small和whisper这两个模型的效果如何呢 > > — > Reply to this email directly, view it on...