Erwin

Results 15 comments of Erwin

不可以,必须传入一个图像,但是你可以问与图片无关的问题。

onnx & TensorRT : https://github.com/wingdzero/GroundingDINO-TensorRT-and-ONNX-Inference?login=from_csdn

> > * examples/whisper/export_onnx.md 里写不支持large-size, 请问是芯片本身不支持某些维度的NN,还是这个转换脚本不支持large? > > * examples/whisper/python/whisper.py 必须指定task为 en 或zh, 但whisper是有语种识别性能,应该是可以直接输入音频,自动判断音频语种,然后输出对应语种的转写结果。这个是芯片本身不支持吗?还是脚本不支持,需要开发者自己调整脚本?请问有做过这方面的尝试吗? > > 1.large理论上是支持的,因为模型太大,能不能跑起来还得取决于板子的硬件情况,如果有兴趣可以自行导出large模型试试,不过记得要修改c demo中的ENCODER_OUTPUT_SIZE参数 2.可以支持先识别语种后在进行转换,这个可以需要自己修改下推理逻辑,因为我们目标是提供语音识别的 demo,所以没有做其他任务 你好,请问你知道日文的tokenizer如何提取吗?我如何尝试保存的tokenizer都是英文的。 ``` tokenizer = WhisperTokenizer.from_pretrained("openai/whisper-small", language="japanese", task="transcribe") tokenizer.set_prefix_tokens(language="japanese", task="transcribe", predict_timestamps=False)...

The image edge distortion is severe, and the target becomes smaller. The difficulty of detection has increased. A large amount of real data that appears on distorted edge targets needs...

> > 我这边尝试了kws-zipformer-wenetspeech-3.3M-2024-01-01这个模型 > > 需要用 rknntoolkit 2.2, 才能转 [@chris1992212](https://github.com/chris1992212) Kuang哥,请问你们开源的kws-zipformer轻量级模型有支持日语的吗?我找了一些,全是英文+汉语的。

瑞芯微就没有一个人来解答一下吗? RK的售后真的是太垃圾了 有问题不给解决,以后谁还买你家芯片。

torch 2.6.0 + CUDA12.4 Thanks a lot

> whisper中文识别任务目前已经支持 你好,请问我下载的官方的tiny模型,想进行日语的ASR任务,如何生成vocab.txt文件啊?是不是替换了这个文件,就可以进行日语的识别了?