cross-modality topics

Image-Text-Embedding

280

Stars

73

Forks

Watchers

TOMM2020 Dual-Path Convolutional Image-Text Embedding :feet: https://arxiv.org/abs/1711.05535

layumi

bidirectional-retrieval

image-retrieval

image-search

language-retrieval

CM-NAS

46

Stars

14

Forks

Watchers

CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification (ICCV2021)

JDAI-CV

cm-nas

cross-modality

nas

neural-architecture-search

CogVLM

5.9k

Stars

407

Forks

Watchers

a state-of-the-art-level open visual language model | 多模态预训练模型

THUDM

cross-modality

language-model

multi-modal

pretrained-models

LLCM

102

Stars

11

Forks

Watchers

[CVPR 2023] Diverse Embedding Expansion Network and Low-Light Cross-Modality Benchmark for Visible-Infrared Person Re-identification

ZYK100

cross-modality

cvpr2023

dataset

llcm

OCN-HOI-Benchmark

16

Stars

1

Forks

Watchers

[AAAI 2022] Detecting Human-Object Interactions with Object-Guided Cross-Modal Calibrated Semantics.

JacobYuan7

cross-modality

detection

detr

end-to-end-pipeline

awesome-multimodal-brain-image-systhesis

27

Stars

6

Forks

Watchers

M-3LAB

brain-images

cross-modality

deep-learning

image-synthesis

awesome-conditional-content-generation

247

Stars

27

Forks

Watchers

Update-to-data resources for conditional content generation, including human motion generation, image or video generation and editing.

haofanwang

aigc

awesome-list

conditional-generation

controllable-generation

ptp

144

Stars

4

Forks

Watchers

[CVPR2023] The code for 《Position-guided Text Prompt for Vision-Language Pre-training》

sail-sg

cross-modality

vision-language-pretraining

vlp

MMN

31

Stars

5

Forks

Watchers

Pytorch code for Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

ZYK100

cross-modality

re-identification

vireid

visible-infrared

Time-LLM

887

Stars

147

Forks

Watchers

[ICLR 2024] Official implementation of " 🦙 Time-LLM: Time Series Forecasting by Reprogramming Large Language Models"

KimMeen

cross-modal-learning

cross-modality

deep-learning

language-model