cross-modal-learning topics

CrossPoint

226

Stars

29

Forks

Watchers

Official implementation of "CrossPoint: Self-Supervised Cross-Modal Contrastive Learning for 3D Point Cloud Understanding" (CVPR, 2022)

MohamedAfham

3d-point-clouds

cross-modal-learning

deep-learning

few-shot-learning

Cross-Modal-Perceptionist

117

Stars

15

Forks

Watchers

CVPR 2022: Cross-Modal Perceptionist: Can Face Geometry be Gleaned from Voices?

choyingw

3d

3d-models

3dmm

biometrics

Text2Pos-CVPR2022

37

Stars

7

Forks

Watchers

Code, dataset and models for our CVPR 2022 publication "Text2Pos"

mako443

computer-vision

cross-modal

cross-modal-learning

cross-modal-retrieval

ACT

91

Stars

5

Forks

Watchers

[ICLR 2023] Autoencoders as Cross-Modal Teachers: Can Pretrained 2D Image Transformers Help 3D Representation Learning?

RunpeiDong

3d-point-clouds

cross-modal-learning

representation-learning

self-supervised-learning

CMFlow

114

Stars

13

Forks

Watchers

[CVPR 2023 Highlight 💡] Hidden Gems: 4D Radar Scene Flow Learning Using Cross-Modal Supervision

Toytiny

4d-radar

automotive-radar

autonomous-driving

cross-modal-learning

Text4Vis

197

Stars

15

Forks

Watchers

【AAAI'2023 & IJCV】Transferring Vision-Language Models for Visual Recognition: A Classifier Perspective

whwu95

action-recognition

cross-modal-learning

transfer-learning

video-recognition

BIKE

154

Stars

17

Forks

Watchers

【CVPR'2023】Bidirectional Cross-Modal Knowledge Exploration for Video Recognition with Pre-trained Vision-Language Models

whwu95

action-recognition

cross-modal-learning

video-language-understanding

video-recognition

Cap4Video

222

Stars

16

Forks

Watchers

【CVPR'2023 Highlight & TPAMI】Cap4Video: What Can Auxiliary Captions Do for Text-Video Retrieval?

whwu95

cross-modal-learning

video-language-understanding

video-text-retrieval

video-understanding

Time-LLM

887

Stars

147

Forks

Watchers

[ICLR 2024] Official implementation of " 🦙 Time-LLM: Time Series Forecasting by Reprogramming Large Language Models"

KimMeen

cross-modal-learning

cross-modality

deep-learning

language-model

SeisMoLLM

17

Stars

7

Forks

17

Watchers

Official Pytorch Implementation of SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language Model

StarMoonWang

ai4science

back-azimuth

cross-modal-learning

diting