ctc_beam_search_lm
ctc_beam_search_lm copied to clipboard
CTC+Beam_Search+kenlm 是用于以汉字为声学模型建模单元的解码系统
此为百度第二代语音识别解码方案C++版本 CTC+BeamSearch+LM
1 ctc_beam_search_decoder.cpp中相关的解码参数
- num_frames:为wav的帧数
- num_classes:为分类的数目,比如建模单元为多少个汉字
- beam_size:beam的大小
- blank_id:ctc训练时,blank的id
- cutoff_prob:为概率剪枝参数
- alpha:为语言模型权重系数
- beta:为句子长度系数
- 输入:经声学模型后的softmax概率prob.txt,以及相应的字表vocab.txt
- 输出:解码结果
2 编译ctc_beam_search_decoder.cpp
1)开始编译: ./compile_decoder.sh
3 运行解码
./ctc_beam_search_decoder