vision-language topics

[IEEE Transactions on Medical Imaging/TMI] This repo is the official implementation of "LViT: Language meets Vision Transformer in Medical Image Segmentation"

HUANGLIZI

medical-image-analysis

pytorch

segmentation

vision-language

VaLM

54

Stars

3

Forks

Watchers

VaLM: Visually-augmented Language Modeling. ICLR 2023.

Victorwz

deep-learning

pre-trained-language-models

vision-language

visually-grounded-language-learning

rtic-gcn-pytorch

20

Stars

3

Forks

Watchers

Official PyTorch Implementation of RITC

nashory

composition

fashion-iq

vision-language

PKOL

44

Stars

0

Forks

Watchers

[TIP 2022] Official code of paper “Video Question Answering with Prior Knowledge and Object-sensitive Learning”

zchoi

pytorch

pytorch-implementation

video-question-answering

video-retrieval

S2-Transformer

78

Stars

4

Forks

Watchers

[IJCAI 2022] Official Pytorch code for paper “S2 Transformer for Image Captioning”

zchoi

ijcai2022

image-captioning

pytorch

transformer

Chinese-CLIP

3.8k

Stars

404

Forks

Watchers

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.

OFA-Sys

chinese

clip

computer-vision

image-text-retrieval

VLTVG

88

Stars

7

Forks

Watchers

Improving Visual Grounding with Visual-Linguistic Verification and Iterative Reasoning, CVPR 2022

yangli18

cross-modal

vision-language

visual-grounding

visual-linguistic