FunASR icon indicating copy to clipboard operation
FunASR copied to clipboard

auto_speech_recognition 这个识别任务中,如何把静默的部分也分出来

Open xiayongtao opened this issue 1 year ago • 0 comments
trafficstars

speech_paraformer-large-eres2net_large-vad-punc-spk_asr_nat-zh-cn 请问下,通过这个识别的句子,是否支持把音频中没有说话的部分通过空白+时间段占位呢?现在看识别的句子时长和音频文件的总时长是差不多的,音频中有空白的部分被分摊到各个句子的时间段中了。

xiayongtao avatar Dec 27 '23 08:12 xiayongtao