eesen-for-thchs30 icon indicating copy to clipboard operation
eesen-for-thchs30 copied to clipboard

ASR for Chinese Mandarin

Results 9 eesen-for-thchs30 issues
Sort by recently updated
recently updated
newest added

我现在想基于你的项目将wfst拿出来单独对ctc的输出做解码,这方面该怎么做,请问你有建议吗? 目前只是构建了LG.fst,我应该重点关注哪一块的代码

根据你的脚本生成LG.fst,一切正常没有报错,但当我执行 fstdraw --isymbols=units.txt --osymbols=words.txt LG.fst > Lg.dot 视图可视化一下 。但却报错,具体内容为: integer 214 is not mapped to any textual symbol,sumbol table=units.txt 好像有个字符不在音素表 但我都是按照步骤执行的。 事实上 只有G.fst可以可视化 L.fst 和LG.fst可视化报同样的错误

您好,非常感谢您所做的工作,我直接采用了thchs30附带的语言模型,但是我在测试中发现总是有如下的错误,估计可能是语言模型或者词典不匹配,可否请您提供一下您测试成功的这两个文件?或者您用thchs30自带的语言模型和词典测试一下,告诉我文件所在的具体位置或者所需的修改,谢谢您!再一次感谢您对这项工作的辛勤付出! Traceback (most recent call last): File "utils/prep_ctc_trans.py", line 75, in out_line += dict[unk_word] + ' ' KeyError: '' Traceback (most recent call last): File "utils/prep_ctc_trans.py", line 75, in out_line...

lz,你好,我运行你的代码,结果 在 train.sh这步出错了,模型训练未能进行下去,请问你知道是什么情况吗?求助,谢谢! steps/train_ctc_parallel.sh --add-deltas true --num-sequence 10 --learn-rate 0.00004 --report-step 10 --halving-after-epoch 12 --feats-tmpdir exp/model_l4_c320/XXXXX data/train data/dev exp/model_l4_c320 feat-to-len scp:data/train/feats.scp ark,t:- feat-to-len scp:data/dev/feats.scp ark,t:- copy-feats 'ark,s,cs:apply-cmvn --norm-vars=true --utt2spk=ark:data/train/utt2spk scp:data/train/cmvn.scp...

您好,您的feature.sh用来生成wav音频数据的fbank特征,40+delta+double delta,但是我没看到您的add-deltas添加到哪里?

准备语言模型languange model ,放入data/language_model目录下,语言模型的文件格式类似于清华的

KALDI_ASSERT: at latgen-faster:InitDecoding:lattice-faster-decoder.cc:65, failed: start_state != fst::kNoStateId 生成4个log,每个log里都是这样

[root@node1 log]# cat initialize_model.log steps/train_ctc_parallel.sh: line 126: net-initialize: command not found