vision-language topics

awesome-vision-language-modeling

25

Stars

2

Forks

Watchers

Recent Advances in Vision-Language Pre-training!

haofanwang

masked-image-modeling

masked-language-models

pre-training

vision-language

NExT-OE

25

Stars

1

Forks

Watchers

NExT-QA: Next Phase of Question-Answering to Explaining Temporal Actions (CVPR'21)

doc-doc

causal-temporal-action-reasoning

multi-object-interaction

video-comprehension

videoqa

rewrite

18

Stars

0

Forks

Watchers

[NeurIPS 2023] Rewrite Caption Semantics: Bridging Semantic Gaps for Language-Supervised Semantic Segmentation

xing0047

neurips-2023

pre-training

segmentation

vision-language

TrackGPT

23

Stars

0

Forks

Watchers

TrackGPT: Track What You Need in Videos via Text Prompts

eshoyuan

segment-anything

video-object-tracking

vision-language

TinyLLaVA_Factory

604

Stars

54

Forks

Watchers

A Framework of Small-scale Large Multimodal Models

TinyLLaVA

large-multimodal-models

llama

llava

nlp

ProText

86

Stars

4

Forks

Watchers

[CVPRW 2024] Official repository of paper titled "Learning to Prompt with Text Only Supervision for Vision-Language Models".

muzairkhattak

text-only-supervision

vision-language

visual-generalization

Sambor

30

Stars

0

Forks

Watchers

Sambor: Boosting Segment Anything Model Towards Open-Vocabulary Learning

ucas-vg

object-detection

open-vocabulary

segment-anything

vision-language

MEP-3M

20

Stars

0

Forks

Watchers

🎁 A Large-scale Multi-modal E-Commerce Products Dataset (LTDL@IJCAI-21 Best Dataset & Pattern Recognition 2023)

ChenDelong1999

vision-language

DeCEMBERT

17

Stars

1

Forks

Watchers

Pytorch version of DeCEMBERT: Learning from Noisy Instructional Videos via Dense Captions and Entropy Minimization (NAACL 2021)

zinengtang

video

video-language

video-language-understanding

vision-language

VLMixer

17

Stars

1

Forks

Watchers

VLMixer: Unpaired Vision-Language Pre-training via Cross-Modal CutMix (ICML 2022)

ttengwang

vision-language

vision-language-pretraining