speech_recognition
speech_recognition copied to clipboard
data
我在清华数据集中没有找到test.word.txt,你能传一下么,还有个问题,我可以在gpu上面训练么,速度好慢呀
https://pan.baidu.com/s/1skGXz8x#list/path=%2F 资料已上传 我用的GTX1050训练了20多个小时
可以试试 换成图像特征是什么意思啊?
估计是想用CNN吧?
@crazygirl1992 你是怎么换的,能共享学习下吗? 模型已上传到网盘!!!
哦哦,我这两天没搞,刚下了你的模型,发现用不了呀,是不是模型和你传的代码不一致呀,,,谢谢
我这边试了没问题,你那边报的什么错
大神,请问下test.word.txt是怎么得到的呢~ 我如果想自己准备语料库,这个文件怎样得到呢?
这个上面的人有传到网盘,自己得到用语音识别得到文本,再用分词对文本处理
这个上面的人有传到网盘,自己得到用语音识别得到文本,再用分词对文本处理 @zhangyangyang1992
这样子啊,明白了,谢谢~ 还有就是上面传的是test的,train的wav和txt哪里有呢?
https://pan.baidu.com/s/1skGXz8x#list/path=%2F
@zhangyangyang1992
@xxbb1234021 上面传的是test的,train的wav和txt哪里有呢?
@provenpeng http://www.openslr.org/18/
@crazygirl1992 哥们楼主的模型你后来能用了吗
不能用,有错误,但是我训练的时候用了gpu也很慢,而且自己训练的准确性很差,你自己训练的模型准确性怎么样? @provenpeng
我下载了清华的那个数据,训练语音用wav_path =/data_thchs30/train, 但是label_file该怎么设置呢,清华的这个train文件中是有后缀为.wav.trn的文件,请问大佬训练的时候是怎么使用清华的这个数据的 @xxbb1234021 @crazygirl1992
清华大学的数据集怎么使用啊@crazygirl1992 为什么train里面有trn文件,还有,项目里的ini文件中的 wav_path以及lablel——path分别应该怎么修改呢?如果wav_path是测试集的路径,那么训练集的路径又在哪里填写呢? 我已经把上面百度云的文件和清华大学的数据集都下载了
@sunshinepython @13253652997 https://pan.baidu.com/s/1hqKwE00#list/path=%2FCSLT%20public%20data%2Fthchs30-standalone%2Fdoc%2Ftrans&parentPath=%2F