FunASR icon indicating copy to clipboard operation
FunASR copied to clipboard

期望使用FunASR时,镜像中没有torchaudio,仅存在librosa也可以正常运行

Open Honst211 opened this issue 1 year ago • 1 comments
trafficstars

我当前构建的镜像中没有torchaudio,期望使用librosa来进行处理 我看了modelscope的源码,你们代码中其实有相关的torchaudio和librosa处理,但是因为import的地方在文件头导致会出现ModuleNotFoundError: No module named 'torchaudio',希望能帮忙处理下这个问题

代码位置是funasr/utils/asr_utils.py image 代码位置是funasr/bin/asr_inference_launch.py image

Honst211 avatar Dec 22 '23 06:12 Honst211

原因是因为我们当前构建的镜像是使用FROM nvcr.io/nvidia/pytorch:23.09-py3,NV构建的镜像是没有torchaudio的,我并不期望在镜像中重新使用pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 来安装,这样会违背了使用NGC的pytorch容器的初衷(避免自己安装torch和Nvidia环境),我们目前没有找到更适合的镜像信息,因此看一下FunASR是否可以在没有torchaudio的情况下只使用librosa

我看了一下当前项目源码中使用torchaudio的,基本上异常处理都会包含一次使用librosa处理的方案,除了torchaudio中使用kaldi的没有,因此这里我直接将kaldi代码从torchaudio中抽出来,这样可以最小化修改代码的前提条件下达成我的目的

我对kaldi中的代码没有更多的研究,单纯的简单处理了一下,我希望你们可以有更好的方案来帮忙进行处理这个问题,或者有其他更好的办法来完成我的想法和需求,非常感谢

这是我的简单修改 https://github.com/Honst211/FunASR/commit/ea8f43437428478ec445b6332e1363a9fc4f60ca#diff-46d81aff6f65ae24bab6475a62c0a6796b31790f7a8e0dfc7f9078c4ab0b77f4

Honst211 avatar Dec 25 '23 07:12 Honst211