SenseVoice
SenseVoice copied to clipboard
微调热词需要准备多少训练数据?
❓ Questions and Help
What is your question?
我想要用微调的方式支持一些热词,每个词需要准备多少音频进行训练比较有效果呢?
@itzhoujun 大佬有尝试吗? 大概准备了多少数据呢
解决了吗,大概准备多少数据,训练多少次能有效果。目前尝试训练一些热词,无效果
我自己测试,感觉看微调前的错字情况,比如说一个四个字的词,微调前只错两个字,我生成了大概50条,配上其他的微调数据,微调结束后能成功识别需要识别的四个字