Jayson Geng issues

Results 2 issues of


                                            Jayson Geng

Performance Concern: VAD Processing Time Long for 22-minute Mono Audio

OS: Linux Python/C++ Version: Python 3.7 Package Version: Model: damo/speech_fsmn_vad_zh-cn-16k-common-pytorch Details: `from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks inference_pipeline = pipeline( task=Tasks.auto_speech_recognition, model='damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', vad_model='damo/speech_fsmn_vad_zh-cn-16k-common-pytorch', punc_model='damo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch', batch_size=64, ) audio_in='/home/FunASR/test_audio/20230807-142709-8026-018529420615-1691389629.668644.wav' rec_result...

认知拓展或待加强

![image](https://user-images.githubusercontent.com/34483957/234185432-419a9ec3-67b4-49c8-a035-91c00cf73afb.png) 在这个例子中，让它更为具体的描述时，他并没有更多的拓展出详细的相关知识，或许是图片太复杂导致其无法记忆太多东西在另一个简单图片的例子中，它能够正确的给出是如何判断图片中是什么狗 ![b86dde7ffe24fe501182150f7de9d75](https://user-images.githubusercontent.com/34483957/234185855-ba676830-995f-4afa-b8f0-584e710863ba.png) 还一个例子中，我给他一张教室中有很多学生在学习的照片，令我惊讶的是，当我问一共有多少学生时，他能大致识别出肉眼可见的学生人数，但当我询问它教室里还有其他什么东西，以及教室后面的黑板上是什么内容时，它回答没有线索