Wenhao Wu

Results 24 repositories owned by


                                            Wenhao Wu

MVFNet

141

Stars

Forks

Watchers

【AAAI'2021】MVFNet: Multi-View Fusion Network for Efficient Video Recognition

whwu95

data-preparation

efficient-video-recognition

model-zoo

video-understanding

DSANet

Stars

Forks

Watchers

【ACMMM'2021】DSANet: Dynamic Segment Aggregation Network for Video-Level Representation Learning

whwu95

model-zoo

video-level-classification

video-understanding

temporal

Text4Vis

197

Stars

Forks

Watchers

【AAAI'2023 & IJCV】Transferring Vision-Language Models for Visual Recognition: A Classifier Perspective

whwu95

action-recognition

cross-modal-learning

transfer-learning

video-recognition

BIKE

154

Stars

Forks

Watchers

【CVPR'2023】Bidirectional Cross-Modal Knowledge Exploration for Video Recognition with Pre-trained Vision-Language Models

whwu95

action-recognition

cross-modal-learning

video-language-understanding

video-recognition

ATM

Stars

Forks

Watchers

【ICCV'2023】What Can Simple Arithmetic Operations Do for Temporal Modeling?

whwu95

action-recognition

temporal-modeling

video-classification-pytorch

Cap4Video

222

Stars

Forks

Watchers

【CVPR'2023 Highlight & TPAMI】Cap4Video: What Can Auxiliary Captions Do for Text-Video Retrieval?

whwu95

cross-modal-learning

video-language-understanding

video-text-retrieval

video-understanding

GPT4Vis

203

Stars

Forks

Watchers

GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition?

whwu95

gpt-4-vision-preview

point-cloud-classification

prompt-engineering

video-recognition

FreeVA

Stars

Forks

Watchers

FreeVA: Offline MLLM as Training-Free Video Assistant

whwu95

chatbot

chatgpt

llava

multimodal-large-language-models