FunASR icon indicating copy to clipboard operation
FunASR copied to clipboard

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.

Results 555 FunASR issues
Sort by recently updated
recently updated
newest added

用官方提供的docker部署的服务(试了多个版本),输入音频是.wav格式,但也许采样率等原因,都报错wave.Error: unknown format: 6,需要自己手动用ffmpeg提前转换一下格式(ffmpeg -i input.wav -ar 16000 output.wav),转换后就没问题。但这与文档里提到的服务集成了ffmpeg不符。查看了仓库,有ffmpeg,但不知为何没有如期运行。 但如果直接用pip安装的funasr, 是集成好了ffmpeg的,不需要自己提前将音频格式转换。

bug

关于 issue#1620,找到一个方法去修复一下,原因应该是 GetInputNameAllocated 没有及时释放。 看有没有问题

使用的cpu离线识别的镜像 使用文档默认配置 在说完一句话停顿几秒钟时,会将停顿的时间计算入说话的时间戳里。 ![image](https://github.com/user-attachments/assets/d31a5239-6b79-43e0-8d5e-f6f29ccb7b48) 实际上每一句话之间都有停顿5~15秒,但是时间戳是连续的 可以看到一个字的时间跨度有1秒以上

bug

Currently, according to the document, the way of using emotion model (e.g emotion2vec) is ``` from funasr import AutoModel model = AutoModel(model="iic/emotion2vec_plus_large") wav_file = f"{model.model_path}/example/test.wav" res = model.generate(wav_file, output_dir="./outputs", granularity="utterance",...

question

## 🐛 Bug Hi I am trying the english ASR model `paraformer-en `, but the output is not in English at all. ### To Reproduce Load the paraformer-en and transcribe...

bug

Notice: In order to resolve issues more efficiently, please raise issue following the template. (注意:为了更加高效率解决您遇到的问题,请按照模板提问,补充细节) ## 🐛 Bug 金额的转换不准确 ### To Reproduce 输入5999元,转换的结果为599¥9 1. Run cmd '....' 2. See error...

bug

输出结果增加置信度输出 修改前输出格式: result_i = {"key": key[i], "text": text} 修改后输出格式:result_i = {"key": key[i], "text": text,"token_probs": token_probs } 以下是一个输出样例 `[ { "key": "en", "text": "The tribal chieftain called for the boy and...

用长文件测试,超过3小时录音,录音里有部分静音或者无人说话,就会出现时间戳偏移 测试录音不方便全网公开,要是有人解决可以私我发测试录音 [email protected]

bug

说话人识别CAM++模型对比pyannote.audio的模型效果如何?谢谢!

question

www.funsound.cn ![image](https://github.com/user-attachments/assets/9c2e9b4a-0357-47ec-8bdc-d905baa47701)