FunASR icon indicating copy to clipboard operation
FunASR copied to clipboard

有大佬能帮我解释一下为什么同样的音频识别多次每次的结果都有差异吗

Open HHUhujiaxin opened this issue 1 year ago • 1 comments

有大佬能帮我解释一下为什么同样的音频识别多次每次的结果都有差异吗

HHUhujiaxin avatar Sep 27 '24 03:09 HHUhujiaxin

请问你说的是python的推理还是C++ runtime?我遇到过funasr1.0之前的python推理出现你讲的问题,当时发现似乎跟wav.scp中的音频顺序有关系,不知道为什么。

lhanzl avatar Oct 16 '24 01:10 lhanzl

音频特征哪里有随机噪声扰动,如果音频是静音,或者声音比较小,就会遇到你说的这个情况

LauraGPT avatar Nov 05 '24 09:11 LauraGPT