FunASR
FunASR copied to clipboard
A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.
环境: 系统--windows python3.8 modelscope==1.10.0 模型下载到本地后,设置哪项参数可以加载本地模型,而不是从网络下载。 ```sh pipeline( task=Tasks.auto_speech_recognition, model='damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online', model_revision='v1.0.6', mode="paraformer_streaming" )
(base) sjy@sjy-System-Product-Name:~/FunASR/runtime/onnxruntime/build/bin$ ./funasr-onnx-offline --model-dir /home/sjy/asr/model --wav-path /home/sjy/asr/testAudio.wav --quantize true --hotword /home/sjy/asr/hotwords.txt I20231228 14:04:19.295624 14499 funasr-onnx-offline.cpp:37] model-dir : /home/sjy/asr/model I20231228 14:04:19.295712 14499 funasr-onnx-offline.cpp:37] quantize : true I20231228 14:04:19.295722 14499 funasr-onnx-offline.cpp:37] wav-path...
时间戳模型返回内容text和timestamp对应长度不一致 text内容按标点分割后长度为183,timestamp去掉标点符号长度为1591,如下图:  出现的问题是:text遍历到地180时,需要获取timestamp第1603个数据,而timestamp长度只有1591,导致低61行出现报错   最后附上返回体: `{'is_final': False, 'mode': 'offline', 'text': '您好,感谢您的接听电话,我是中国电信的预处理中心工号011 。请问您报故障了,说家里的网用不了了吗?你现在在家里吗?是网直接连不 上吧,还是怎么了?就您家里的无线网的名字直接搜不到了是吧?那就是那个路由器有问题,路由器就是带天线比较多的那个路由器,它的灯不亮是吧?哎,我就说您看一下光猫上亮的哪几盏灯, 您看一下。嗯,对,wifi的这个盒子翻过去底部,然后栏有有个贴纸,您看一下。先生,天翼王冠,您的这个光猫是竖着立起来的一个盒子吗?啊,行吧,那你把它那个啥呃,翻过去底部底部,然 后有一个贴纸,贴纸上面写了一个叫做默认网络无线名称,您看一下有没有您不要拔,您拔你网都用不了,肯定就没了呀。先生,哦,看不到是吧?那行吧,那那行吧,默认网络无限名称,您拍个 照,手机上把这个贴纸拍个照,默认网络无线名称先生或者是wifi名称贴纸。嗯,然后你现在把这个把这个拍个照,然后你把这个盒子插上插上以后,那个无线的灯亮起来。然后您在您手机上找一 下这个wifi,您看能不能找到。嗯嗯,我们的人过来就到明天了,我们的规定时间24h,我给您挂了,就不您不挂可以吗?您是吗?先生,插上了,没分迁箱,跟您家里的无线网是没关系的。先生,分迁箱是管的是光猫,您家里的无线网的wifi名字都找不见了,是您的路由器有问题了。对对对,就是对,但是就是我跟您说,他这个分迁箱,它是管的是光猫,就是光纤入户的问题,就是您的只 要您的光猫上的无线网能找到就是路由器的问题。所以就是我现在就是您不是在排查嘛,我也在给您排查。那我们这边的话就相对来说嗯比较呃就是相对您来说的话,这边就比较看一下呃,无线wifi网络名称,就是有一个肺癌,这就叉ina net什么什么的,看到了吗?对,然后您现在您手机的无线网的名字里边找一下这个wifi名,看能不能找到。对,点链接,您看他是不是让您输密码呢,密 码就在那个贴。呃,我不是我,刚才让您拍照了嘛,贴纸上面写了一个叫做默认网络密钥,就下面一行有一个密码输进去,括号里边的不输,把括号外边的输上就行了。嗯,我给你不挂电话,你慢 慢说,不接受,就是因为路由器坏了。先生,就是您家里不是有您先您先输上,输上,您看能用不一。对,就是所以我就说让您赶紧把这个网连上先让孩子用嘛,先让孩子学习先用。呃,您看输上 了没连上了是吧?能用不能用啊?好,那现在就是您您刚才跟我说的那个路由器上的灯不亮了,那路由器的灯不亮了,你有没有把路由器后边的电源线拔掉,重新插过先生?嗯,行,那要不就是您 找一个或者是实在不行,那您就找一根多余的电源线,换个电源线,看一下是线有问题还是盒子有问题,肯定这两个有问题了。先生,所以您家里的以前的那个无线网找不见了。因为以前的无线网 是用路由器来发出来的嘛,它的灯都不亮了,就证明它的这个网它的这个盒子关闭了,所以这个网络就发不过来了。它有可能是电源不通,也有可能路由器坏了。先生连的哪个?对,就你一直也用 的这个wifi吗?嗯,那行吧,那如果您一直用不是啊,先生,您一直用的是您的路由器,您是把路由器的无线网改成您的房号了。然后您现在这个路由器它不通上不通电了不通电,所以您家里的那 个房号的wifi名字就找不见了啊。您这现在是两个问题,第一,您是先找一根电源线,先看一下是这根线有问题,还是这个盒子有问题。如果盒子有问题,得需要您自行更换盒子了。如果您不想换 这个光猫上的无线网,你也是可以用的,你也可以让孩子正常连上用你们家里用这个无线网也是可以的这都是您家里的网啊。嗯路由器都用了好长时间吗?用了多长时间了?先生,5年了,是当时是咱们电信的吗?自己买的电信的啊,那您就找一根多余的线试一下。或者就是您把您光猫就是光猫,刚才不是有一根细细的源头电源线嘛,您刚才不是拔了吗?然后您把这个电源线插到那个路由器 上,您看路由器的灯亮不亮。如果有一个灯亮,不管它是红灯还是亮,绿灯,只要有一个灯亮,那就证明这个呃线坏了,您换上一根线就行了。如果说是它的灯还是不亮,就路由器坏了得需要您换...
https://github.com/alibaba-damo-academy/FunASR/tree/dev_gzf_funasr2/examples/industrial_data_pretraining 里面的例子中没有同时支持热词和时间戳的长音频模型
环境:ubuntu 4核8G 镜像:funasr:funasr-runtime-sdk-cpu-0.3.0 根据文档,使用docker部署。 已经成功部署,并且可以调用成功。 客户端调用命令: python funasr_wss_client.py --host "127.0.0.1" --port 10095 --mode offline --audio_in t3.scp scp文件里是24个mp4文件列表,长度为5分钟,运行到第20个时服务端出现:  服务端被killed,是因为内存不够了吗,还是已运行的内存没有充分释放。 我应该如何解决此问题。 如果我想同时并行4个10分钟以内的视频,建议什么配置呢。
I can start the service normally using the official Docker image, and I can transcribe it normally, but as soon as I send the wrong ws.send to the server, the...
请教热词的问题
xxx 20 后边这个权重的范围是多大? 有没有热词数量上的限制?
如题,感谢大佬! C++ 不熟,看了一阵源码,没搞懂在什么地方处理时间戳数据,还请大佬们能帮助下 无比感谢。!
speech_paraformer-large-eres2net_large-vad-punc-spk_asr_nat-zh-cn 请问下,通过这个识别的句子,是否支持把音频中没有说话的部分通过空白+时间段占位呢?现在看识别的句子时长和音频文件的总时长是差不多的,音频中有空白的部分被分摊到各个句子的时间段中了。
funasr::FUNASR_VAD_RESULT* p_result = new funasr::FUNASR_VAD_RESULT; // 这里没有初始化segments字段,析构时出现异常 p_result->snippet_time = audio.GetTimeLen(); if(p_result->snippet_time == 0){ return p_result; }