vision-and-language-pre-training topics

The Paper List of Large Multi-Modality Model (Perception, Generation, Unification), Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insigh...

Paranioar

awesome

awesome-list

cross-modal-retrieval

image-retrieval

awesome-Vision-and-Language-Pre-training

281

Stars

15

Forks

Watchers

Recent Advances in Vision and Language Pre-training (VLP)

phellonchen

multimodal-deep-learning

pretraining

vision-and-language

vision-and-language-pre-training

awesome-vision-and-language-pretraining

54

Stars

6

Forks

Watchers

A curated list of vision-and-language pre-training (VLP). :-)

zhjohnchan

multi-modal-learning

pre-training

vision-and-language-pre-training

Chinese-CLIP

3.8k

Stars

404

Forks

Watchers

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.

OFA-Sys

chinese

clip

computer-vision

image-text-retrieval

SIC-CADS

21

Stars

3

Forks

Watchers

Code Implementation of "Simple Image-level Classification Improves Open-vocabulary Object Detection" (AAAI'24)

mala-lab

foundation-models

object-detection

open-vocabulary-detection

vision-and-language-pre-training