TensorflowASR icon indicating copy to clipboard operation
TensorflowASR copied to clipboard

希望添加命令词模型或例子教程

Open fettliu opened this issue 2 years ago • 3 comments

现在几乎所有语音库感觉都是语音训练库,不好直接使用,名不副实。 希望分个库专门提供特定语音识别功能(功能,而不是学术倾向的训练器)。提供VAD函数及分析函数,参数是音频,返回是否含有语音,及音频识别结果。 库的功能可以是:语音转命令/词组、语音转音素、语音转句子。

我现在最需要的是语音转音素,用在单片机,训练出来的库越小越好,不能超过1M尺寸。识别库需要支持c/c++。 作为参考,上海乐鑫ESP32这MCU只有4M存储500KB不到的内存,但是官方的语音识别可以做到语音转音素,但不开源。

fettliu avatar Dec 29 '21 08:12 fettliu

你这更倾向于微片的定制开发了

微片的东西需要定制的点比较多,不同的微片可能整个代码结构都不同了,还需配合硬件(如果有硬件部门的话)进行C model验证工程,所以少有基于微片的开源项目 :)

Z-yq avatar Jan 05 '22 07:01 Z-yq

其实只需要提供一个尽可能小的TF Lite预训练模型,现在几乎所有单片机都支持C/C++语言,移植一个TFLite是小事。 我这种应用开发者,对训练不是很感兴趣,几乎对库的理解应该是立刻使用,不搞学术。 若库主有时间,请向这个方向走一步,方便一下我们使用。有小型模型,不至于单片机,我还想用到HTML5的Web上,做到WASM里,为Web提供强力语音命令识别能力。 请做语音库的强力推动者。

fettliu avatar Jan 05 '22 08:01 fettliu

后续慢慢完善吧

Z-yq avatar Jan 09 '22 13:01 Z-yq