Cheshire
Cheshire
> 确实有时候用v3翻译突然卡死就一直显示处理中,翻译好几次俄语都出现这种情况 显存不足了
> 模型可以正常加载,使用的是您提供的large2,一到开始处理就卡在这  `==========2024-07-17_19:08:02========== ==========Process========== > > redirect std output vad_filter : True -threshold : 0.5 -min_speech_duration_ms : 250 -max_speech_duration_s : inf -min_silence_duration_ms : 2000 -window_size_samples : 1024 -speech_pad_ms :...
Whisper 不翻译任何内容,Whisper 输出直接通过token生成对应语言的结果,Whisper 不是一个 音频处理技术 项目而是一个 NLP 项目。
> > 版本? > > 0.8.0 你看看共享显存是不是也高占用,如果是的话,那就是显存不够了,启用内存给显卡共享了,导致速度慢,可以在使用 whisperX 之前卸载 fw 模型腾出显存
显存本身不够的时候,才会使用共享显存,共享显存就会造成速度慢,说话人分离是基于聚类算法开发的深度学习模型,效果不一定准确,区分不够的话把最大、最小说话人都设置成 2 ,可能会好点儿
说话人分离这个功能可能就是这样了,聚类模型本身的局限性
> 为什么我点了 WhisperX说话人分离 后没有任何反应呢?令牌也设置了 看看日志
> > > > 为什么我点了 WhisperX说话人分离 后没有任何反应呢?令牌也设置了 > > > > > > > > > 看看日志 > > > > > > 感谢回复,看了一下日志显示: Traceback (most recent call last): File...
文本未完全翻译这个情况确实存在,你可以尝试把语言参数指定为 英文,不开翻译选项试一下