audio-visual-learning topics

CVPR2023-CMPAE

34

Stars

3

Forks

Watchers

[CVPR 2023] Collecting Cross-Modal Presence-Absence Evidence for Weakly-Supervised Audio-Visual Event Perception

MengyuanChen21

audio-visual

audio-visual-learning

audio-visual-video-parsing

cvpr2023

MGN

19

Stars

0

Forks

Watchers

Official implementation for MGN

stoneMo

audio-visual-learning

audio-visual-parsing

multimodal-learning

weakly-supervised-learning

UnAV

50

Stars

3

Forks

Watchers

Dense-Localizing Audio-Visual Events in Untrimmed Videos: A Large-Scale Benchmark and Baseline (CVPR 2023)

ttgeng233

audio-visual-events

audio-visual-learning

multi-modal-learning

av-superb

38

Stars

3

Forks

Watchers

A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models (ICASSP 2024)

roger-tseng

audio-visual-learning

representation-learning

AVGN

32

Stars

4

Forks

Watchers

Official implementation for AVGN

stoneMo

audio-visual-correspondence

audio-visual-learning

visual-sound-localization

weakly-supervised-learning

CPSP

19

Stars

4

Forks

Watchers

[2022 TPAMI] Contrastive Positive Sample Propagation along the Audio-Visual Event Line

jasongief

audio-visual-events

audio-visual-learning

audio-visual-parsing

EDTalk

225

Stars

17

Forks

Watchers

[ECCV 2024] EDTalk - Official PyTorch Implementation

tanshuai0219

audio-visual-learning

face-animation

talking-face-generation

talking-head

Joint-Cross-Attention-for-Audio-Visual-Fusion

24

Stars

4

Forks

Watchers

IEEE T-BIOM : "Audio-Visual Fusion for Emotion Recognition in the Valence-Arousal Space Using Joint Cross-Attention"

praveena2j

affective-computing

attention

attention-model

audio-visual-learning

JointCrossAttentional-AV-Fusion

32

Stars

9

Forks

Watchers

ABAW3 (CVPRW): A Joint Cross-Attention Model for Audio-Visual Fusion in Dimensional Emotion Recognition

praveena2j

affective-computing

attention-model

audio-visual-learning

emotion

Cross-Attentional-AV-Fusion

24

Stars

4

Forks

Watchers

FG2021: Cross Attentional AV Fusion for Dimensional Emotion Recognition

praveena2j

affective-computing

attention-model

audio-visual-learning

emotion