cross-modal-retrieval topics

clip-as-service

12.2k

Stars

2.1k

Forks

Watchers

🏄 Scalable embedding, reasoning, ranking for images and sentences with CLIP

jina-ai

bert

bert-as-service

clip-as-service

clip-model

X-modaler is a versatile and high-performance codebase for cross-modal analytics(e.g., image captioning, video captioning, vision-language pre-training, visual question answering, visual commonsense r...

YehLi

cross-modal-retrieval

image-captioning

pretraining

tden

pvse

131

Stars

24

Forks

Watchers

Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval (CVPR 2019)

yalesong

cross-modal-retrieval

metric-learning

mrw-dataset

mscoco-dataset

Awesome_Matching_Pretraining_Transfering

434

Stars

49

Forks

434

Watchers

The Paper List of Large Multi-Modality Model (Perception, Generation, Unification), Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insigh...

Paranioar

awesome

awesome-list

cross-modal-retrieval

image-retrieval