charlesw1234
charlesw1234
我明白了,多谢指点。稍晚点我开个 git,把我代码发出来供大家解剖玩耍。
提交到这里了: https://github.com/charlesw1234/fastc-asr 问题我还没来得及改。只要把 k2_rnnt2_cli 的 wenet_params.bin 放到 models/k2_rnnt2_cli/ 目录里,然后再运行: tests/test-kaldi2.exe tests/hhxx.ttxs.wav 就可以看到结果了。 我是用一个叫 scons 的编译工具来编译的,在 ubuntu 里面,只要: apt-get install scons 就行了。运行 scons 就可以完成编译。 读取 wav,我用了 libsndfile,所以在 ubuntu 里面要:apt-get install libssl-dev...
好多天没上来看了,一个是公司事情忙,一个是懒(主要是这原因 :) )。我是两个没想到,一个是没想到 @chenkui164 会帮忙找出 bug......,所以我今天上午花了两个小时把问题找出来了,正是你说的..... *max_at = 0 忘记了。这是我的第二个没想到,竟然阴沟翻船了。 :p 早知道你就帮忙找出来我就偷懒了,哈哈。 调试过程中我发现一个有趣的现象: ```c #include #include #include #define FFT_SIZE 512 #define STEP 4 int main(void) { //float fft_input[FFT_SIZE]; //fftwf_complex fft_output[FFT_SIZE];...