FunASR issues

Dev multi blank

2

combined the multi blank into the funasr for transducer

nichongjia-2007

How to decode Lora finetune model

3

ubuntu20.04, funasr&modelscope is last version. Lora finetune model can not decode: RuntimeError：AutomaticSpeechRecognitionPipeline：Error（s）in loading state_dict for Paraformer： unexpected key(s) in state_dict: "encoder.encoders0.0.self_attn.linear_q_k_v.lora_A"

lhanzl

bug

Memory leak in funasr-runtime-sdk-cpu-0.2.1 ?

Thank you for contributing excellent code. I encountered a problem when using both online and offline SDKs Docker Version: registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.2.1 SDK: ./funasr-wss-server & ./funasr-wss-server-2pass Command：python3 funasr_wss_client.py --host "127.0.0.1" --port 10095...

lhanzl

bug

Onnx vad 的结果与pipeline vad的结果偏差较大

OS: mac Python/C++ Version：python 3.7.0 Package Version：torch 1.13.1、torchaudio 0.13.1、modelscope 1.6.1、funasr version 0.7.6 Model：damo/speech_fsmn_vad_zh-cn-16k-common-pytorch、damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404 Command： [音频和代码.zip](https://github.com/alibaba-damo-academy/FunASR/files/12591570/default.zip) 大体上是对同一段音频，分别利用pipeline的vad和onnx的vad，然后对两个vad的结果进行onnx的asr，结果是，因为vad结果的差异，造成asr里有些静音被识别成中文。 ` # 原始文件8K PCM TO 16K PCM speech = resample(fs=8000, audio_in=speech) # pipeline vad...

fatmop

更新推理和IO的线程数量并重启FunASR服务不生效

OS: linux Python/C++ Version：3.10/g++ (GCC) 5.4.0 Package Version：pytorch、torchaudio、modelscope、funasr version（pip list） Package Version ---------- ------- click 8.1.7 pip 23.2.1 setuptools 65.5.0 websockets 11.0.3 Model： The ASR model_id used : damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx The...

yu-you

bug

后处理数据问题

作者您好，我注意到[ModelScope]的后处理标点恢复部分能够处理中文、英文以及中英混的情况，请问作者在后处理部分模型训练时，数据集是如何构建的呢？比如中英混，中英混数据是通过什么方法构建的，谢谢作者

zhanghanweii

客户端python执行推理音频卡住

4

![image](https://github.com/alibaba-damo-academy/FunASR/assets/87591236/640b0898-4304-4da2-8de4-c60900a9e3ea) ![image](https://github.com/alibaba-damo-academy/FunASR/assets/87591236/1f382bc5-84c9-40ce-87e8-3aca82839b5b) 以下是执行测试案例中的音频运行效果 ![image](https://github.com/alibaba-damo-academy/FunASR/assets/87591236/c399b928-837f-41e8-89ce-d9eea30888ba)

HaSaKiYasuooo

Performance Concern: VAD Processing Time Long for 22-minute Mono Audio

OS: Linux Python/C++ Version: Python 3.7 Package Version: Model: damo/speech_fsmn_vad_zh-cn-16k-common-pytorch Details: `from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks inference_pipeline = pipeline( task=Tasks.auto_speech_recognition, model='damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', vad_model='damo/speech_fsmn_vad_zh-cn-16k-common-pytorch', punc_model='damo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch', batch_size=64, ) audio_in='/home/FunASR/test_audio/20230807-142709-8026-018529420615-1691389629.668644.wav' rec_result...

JaysonGeng

训练模型需要联网吗？

指定了模型路径，仍然日志打印网络连接错误。 (funasr) ctc@HP-Z6-G4-Workstation:~/anaconda3/envs/funasr/FunASR/egs_modelscope/asr/paraformer/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch$ python finetune.py 2023-09-05 17:08:25,544 - modelscope - INFO - PyTorch version 1.13.1+cu117 Found. 2023-09-05 17:08:25,544 - modelscope - INFO - Loading ast index from /home/ctc/.cache/modelscope/ast_indexer 2023-09-05 17:08:25,607...

GlocKieHuan

采用websocket协议的c++ Windows部署方案

2

希望有采用websocket协议的c++ windows部署方案最好出个Relese包

cgisky1980

FunASR
FunASR copied to clipboard

Metadata

Dev multi blank

How to decode Lora finetune model

Memory leak in funasr-runtime-sdk-cpu-0.2.1 ?

Onnx vad 的结果与pipeline vad的结果偏差较大

更新推理和IO的线程数量并重启FunASR服务不生效

后处理数据问题

客户端python执行推理音频卡住

Performance Concern: VAD Processing Time Long for 22-minute Mono Audio

训练模型需要联网吗？

采用websocket协议的c++ Windows部署方案

← Metadata

Owner

Metadata

FunASR FunASR copied to clipboard

Metadata

← Metadata

Owner

Metadata

FunASR
FunASR copied to clipboard