RapidASR icon indicating copy to clipboard operation
RapidASR copied to clipboard

商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide a set of easier APIs to call ASR...

Results 15 RapidASR issues
Sort by recently updated
recently updated
newest added

请问如何输出结果是阿拉伯数字呢,目前输出的都不是阿拉伯数字 谢谢!

回答的结果是['百必苦之说苦是苦苦之之苦是苦之之之此苦之苦之之之此此之之苦苦之谷谷此之谷此苦之之谷此谷苦谷之之谷苦之谷此是苦之谷此是苦之之苦三之谷此谷苦之之谷此之果苦之之谷故苦之谷此苦],但是实际语音并不是这个 谢谢!

描述:用文中ONNX模型结果识别出错,或者提到的命令,从达摩院官网重新转换的模型识别同样错误。但是达摩院的默认pytorch模型正确(达摩院官网的在线体验也是正确)! [测试语音:] [20230815_170837_285.zip](https://github.com/RapidAI/RapidASR/files/12374682/20230815_170837_285.zip) 1.错误示例: ![image](https://github.com/RapidAI/RapidASR/assets/30890794/f973051f-b83c-48fc-b0c8-b52f82f51bb7) [2.正确示例:] ![image](https://github.com/RapidAI/RapidASR/assets/30890794/028c0dde-6150-4791-8297-912b18478a08)

为什么英文识别效果很差呢,试了wenet以及paddle的,都把英文识别成中文了,有需要设置的地方吗

模型参考这里:[热词模型](https://www.modelscope.cn/models/damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404/summary)

enhancement

相比于FastAsr,模型加载时间长10多倍,有什么方法可以加速么

1、demo修改了支持长音频转录 2、支持各个模型组合转录 3、尝试了多进程和多线程在推理环节,发现多线程快一点

enhancement

识别效果很好很快,感谢开发者开源这个伟大的工作。希望可以有文字对应时间戳的功能

enhancement