sherpa-onnx Re-implement LM rescore for online transducer

Re-implement LM rescore for online transducer

Open SilverSulfide opened this issue 1 year ago • 0 comments

Shallow fusion can be too slow for online cpu inference. Added an option to use classical LM rescore instead.

CPU runtime comparison for ~1 min wav file using the default --lm-num-threads=1

Aug 07 '24 10:08 SilverSulfide