ASRT_SpeechRecognition icon indicating copy to clipboard operation
ASRT_SpeechRecognition copied to clipboard

A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统

Results 112 ASRT_SpeechRecognition issues
Sort by recently updated
recently updated
newest added

我用自己的声音测的speech_model251_e_0_step_625000.model模型的效果不是很好,但是作者提供的在线demo的效果实测的不错。请问是有在基于speech_model251_e_0_step_625000.model继续训练吗?

大家好,我在Google Cloab上运行python train_mspeech.py,一直得到语音单字错误率和dev单字错误率为100%,而且loss到了210左右下降很慢,请问正常吗? ` *[测试结果]语音识别dev集语音单字错误率:100.0% [message epodh. Have train datas11000+ Epoch 1/1 500/500[ ========================]-145s291ms/step-loss:209.9455 测试进度:0/4 *[测试结果]语音识别 train集语音单字错误率:100.0% 测试进度:0/4 *[测试结果]语音识别dev集语音单字错误率:100.0% [message] epoch 0. Have train datas 11500+ Epoch 1/1 500/500[=====================]-144s288ms/step-loss:210.5319 测试进度:0/4...

通过和pypinyin库中的拼音比较,移除dict文件中的错误拼音记录

I download ST-CMDS-20170001_1-OS.tar.gz, unzip in the dataset, when i run `python train_mspeech.py`, will raise FileNotFoundError: [Errno 2] No such file or directory: 'dataset/ST-CMDS-20170001_1-OS/20170001P00354A0118.wav' and i search the dataset file ,i...

您好,请问这个工程有对应的期刊论文嘛? (课程老师要求复现一篇深度学习的论文~)

前端上传的录音文件如图1; 在后端怎么解码进行识别呢,现在是下面的情况如图2 图1 ![image](https://user-images.githubusercontent.com/63533705/120876281-7455e880-c5e2-11eb-80f8-f29ce61e0223.png) 图2 ![image](https://user-images.githubusercontent.com/63533705/120876261-5f795500-c5e2-11eb-8bb9-526df1628501.png)

train_mspeech 训练出来的应该只是model_speech模型,但是model language没有提供训练。

您好,想詢問您關於輸入CNN網絡的200維特徵是如何從MFCC39維的特徵值中轉換的呢?謝謝

不知道您这个项目是否能训练谷歌英文的数据集?如果不适合,有没有一些适合的推荐一些,感谢感谢