sherpa-onnx
sherpa-onnx copied to clipboard
语音唤醒是否能改成只识别当前帧和之前一定时间内的结果
问题
目前的算法是如果识别到1.5秒静默帧或者识别到唤醒词才会reset清除之前识别出来的token,但是如果有一个唤醒词没有识别出来,接下来相似的唤醒词就有很大几率无法识别。
建议
每次beam search仅搜索当前帧和之前一定时间内(如2秒)的结果