FireRedTeam

Results 58 comments of


                                            FireRedTeam

fix sample rate error in asr_feat.py

Thanks for your pull request! We'll review the code.

标点符号支持有问题？

目前不支持自动加标点。需要用额外的模型去做。

音频中静音部分影响转写？

先用VAD切分一下呢？

神奇音频，有这句rtf就会变慢，单独识别这句它的rtf也比其他单句慢10倍

识别的文本结果正确吗？

神奇音频，有这句rtf就会变慢，单独识别这句它的rtf也比其他单句慢10倍

这句话多长呢？采样率采样位数对着吗？

神奇音频，有这句rtf就会变慢，单独识别这句它的rtf也比其他单句慢10倍

输入语音多长，输出文本多长

batch!=1使用llm出现了一些重复解码的case是什么问题，怎么解决

"训练的时候是不是需要按照readme所说做一个时长的数据预处理，将时长相近的wav组成一个个batch来提feats" 是的。

batch!=1使用llm出现了一些重复解码的case是什么问题，怎么解决

“如果不管时长直接整体提特征，而后训练，可能问题也不大？” 这样训练中可能一个batch内的padding较多，会降低训练效率。

我在识别个别的语音的时候会有报错

Audio too long. https://github.com/FireRedTeam/FireRedASR?tab=readme-ov-file#input-length-limitations

FireRedASR-LLM报错：index out of range in self

解决了吗？

‹
1
2
3
4
5
6
›