Jayson Geng
Jayson Geng
OS: Linux Python/C++ Version: Python 3.7 Package Version: Model: damo/speech_fsmn_vad_zh-cn-16k-common-pytorch Details: `from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks inference_pipeline = pipeline( task=Tasks.auto_speech_recognition, model='damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', vad_model='damo/speech_fsmn_vad_zh-cn-16k-common-pytorch', punc_model='damo/punc_ct-transformer_zh-cn-common-vocab272727-pytorch', batch_size=64, ) audio_in='/home/FunASR/test_audio/20230807-142709-8026-018529420615-1691389629.668644.wav' rec_result...
认知拓展或待加强
 在这个例子中,让它更为具体的描述时,他并没有更多的拓展出详细的相关知识,或许是图片太复杂导致其无法记忆太多东西 在另一个简单图片的例子中,它能够正确的给出是如何判断图片中是什么狗  还一个例子中,我给他一张教室中有很多学生在学习的照片,令我惊讶的是,当我问一共有多少学生时,他能大致识别出肉眼可见的学生人数,但当我询问它教室里还有其他什么东西,以及教室后面的黑板上是什么内容时,它回答没有线索