SapphireLab
SapphireLab
来点反馈,是不是改得太多了😂
> Faster Whisper ASR large模型,生成的list文件里面出现大量的重复字段,例如: `G:\Datasets\GuYunAGI\VerinAudio\slice\12.flac_0011459520_0011566720.wav|slice|EN|And the time the outside world is, and the time the outside world is, and the time the outside world is, and the time the...
> > > Faster Whisper ASR large模型,生成的list文件里面出现大量的重复字段,例如: `G:\Datasets\GuYunAGI\VerinAudio\slice\12.flac_0011459520_0011566720.wav|slice|EN|And the time the outside world is, and the time the outside world is, and the time the outside world is, and the...
> 找到原因了,是模型幻觉问题。如果whisper遇到长时间的沉默就会不断重复之前的短语或短句。 `segments, info = model.transcribe( audio=file, beam_size=5, vad_filter=True, vad_parameters=dict(min_silence_duration_ms=700), condition_on_previous_text=False, suppress_tokens=[], language=language)` 这一部分中我添加了两个参数 condition_on_previous_text=False, suppress_tokens=[]试图抑制幻觉,可以在Webui中添加一个抑制幻觉选项。 长时间沉默是指语音中静音段较长?再进行适当切分应该不会出现此问题?
> > > 找到原因了,是模型幻觉问题。如果whisper遇到长时间的沉默就会不断重复之前的短语或短句。 `segments, info = model.transcribe( audio=file, beam_size=5, vad_filter=True, vad_parameters=dict(min_silence_duration_ms=700), condition_on_previous_text=False, suppress_tokens=[], language=language)` 这一部分中我添加了两个参数 condition_on_previous_text=False, suppress_tokens=[]试图抑制幻觉,可以在Webui中添加一个抑制幻觉选项。 > > > > > > 长时间沉默是指语音中静音段较长?再进行适当切分应该不会出现此问题? > > 我切分后的语音有些不到三秒,但依旧有此问题。 顺带一提, `segments,...
文件冲突, 关闭PR
> 我也想问有没有简单一点的方法,因为是弄给我爸用的。他是搞设计的,科学上网、Github和命令号对于他来说有点复杂了。 已经有增量更新包了啊,看[文档](https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e?#)整合包教程部分
pretrained_models下有没有相应模型?下载地址在README就有
不知你是什么系统?以及之前是否安装过 32 位的 python?
后面没有了?