wukong-contrib icon indicating copy to clipboard operation
wukong-contrib copied to clipboard

悟空可以使用离线引擎进行语音识别吗?

Open cgn5566 opened this issue 5 years ago • 4 comments

您好,我分别使用了百度、讯飞、和腾讯的在线语音识别服务,但是效果都不理想,我看叮当镜像文件里面有装很多离线STT,悟空是不是也可以用离线语音识别引擎进行语音识别啊?可以把离线识别的引擎配置到悟空里面吗?如果可以那真是太好了,悟空的自由度和灵活性一定会有很大的提高,体验也会更好。

cgn5566 avatar Nov 20 '19 06:11 cgn5566

效果不理想是指反应速度不理想还是识别准确率不理想? 如果是前者,百度ASR极速接口了解一下。 如果是后者,离线识别只会更差。 离线识别目前没有restful,大多都是提供给APP使用的sdk,且基本都是收费的。所以wukobg-robot不考虑接入。 试过开源的ASRT,效果也不太理想,所以最终没有接入。

wzpan avatar Nov 20 '19 11:11 wzpan

您好,主要是识别率不高,有时候识别的比较准,有时候不准,识别不准的话很影响用户体验,也极大限制了悟空的能力。依赖于在线的语音识别服务既不够灵活又容易受到很多限制,现在有很多开源的ASR可用,比如MASR等等,如果能集成到悟空当中就好了,特定领域的数据量不会特别大,以目前硬件的处理能力和发展速度来看,使用本地离线语音识别引擎处进行识别应该没有问题的,到时候处理速度和识别率很可能都会有一个大的提升,也会使悟空应用的范围更广,更实用。

cgn5566 avatar Nov 21 '19 02:11 cgn5566

开源的 ASR 是可以用,但是效果能有商业 ASR 好吗?这个我有存疑。

wukong-robot 本身是可扩展的,你可以自己试试接入。

wzpan avatar Nov 21 '19 03:11 wzpan

好的

cgn5566 avatar Nov 21 '19 21:11 cgn5566