TensorflowASR 希望添加命令词模型或例子教程

希望添加命令词模型或例子教程

Open fettliu opened this issue 2 years ago • 3 comments

现在几乎所有语音库感觉都是语音训练库，不好直接使用，名不副实。希望分个库专门提供特定语音识别功能（功能，而不是学术倾向的训练器）。提供VAD函数及分析函数，参数是音频，返回是否含有语音，及音频识别结果。库的功能可以是：语音转命令/词组、语音转音素、语音转句子。

我现在最需要的是语音转音素，用在单片机，训练出来的库越小越好，不能超过1M尺寸。识别库需要支持c/c++。作为参考，上海乐鑫ESP32这MCU只有4M存储500KB不到的内存，但是官方的语音识别可以做到语音转音素，但不开源。

Dec 29 '21 08:12 fettliu

你这更倾向于微片的定制开发了

微片的东西需要定制的点比较多，不同的微片可能整个代码结构都不同了，还需配合硬件（如果有硬件部门的话）进行C model验证工程，所以少有基于微片的开源项目：）

Jan 05 '22 07:01 Z-yq

其实只需要提供一个尽可能小的TF Lite预训练模型，现在几乎所有单片机都支持C/C++语言，移植一个TFLite是小事。我这种应用开发者，对训练不是很感兴趣，几乎对库的理解应该是立刻使用，不搞学术。若库主有时间，请向这个方向走一步，方便一下我们使用。有小型模型，不至于单片机，我还想用到HTML5的Web上，做到WASM里，为Web提供强力语音命令识别能力。请做语音库的强力推动者。

Jan 05 '22 08:01 fettliu

后续慢慢完善吧

Jan 09 '22 13:01 Z-yq

TensorflowASR TensorflowASR copied to clipboard

希望添加命令词模型或例子教程

TensorflowASR
TensorflowASR copied to clipboard