VITA
VITA copied to clipboard
rtsp推流和对话问询
能否通过rtsp推流过来,如5路数据,推流的内容可以是源视频或者yolo识别后的视频,而后在本地通过语言问询各路视频的情况,如“刚才各路数据是否有异常的目标检测?”
不要把这个模型想的太神了,视频分析能力,语音识别能力和大语言推理分析能力都很一般