vision-and-language topics

Research Code for NeurIPS 2020 Spotlight paper "Large-Scale Adversarial Training for Vision-and-Language Representation Learning": UNITER adversarial training part

zhegan27

adversarial-training

neurips-2020

pretraining

vision-and-language

ALPRO

184

Stars

18

Forks

Watchers

Align and Prompt: Video-and-Language Pre-training with Entity Prompts

salesforce

prompt-learning

representation-learning

video-language

video-question-answering

stanford-cs231n-assignments-2020

154

Stars

65

Forks

Watchers

This repository contains my solutions to the assignments for Stanford's CS231n "Convolutional Neural Networks for Visual Recognition" (Spring 2020).

amanchadha

attention-mechanism

captioning-images

cnns

computer-vision

PhraseCutDataset

97

Stars

11

Forks

Watchers

Dataset API for "PhraseCut: Language-based Image Segmentation in the Wild"

ChenyunWu

computer-vision

cvpr2020

datasets

referring-image-segmentation

VAL

62

Stars

11

Forks

Watchers

Tensorflow Implementation on Paper [CVPR2020]Image Search with Text Feedback by Visiolinguistic Attention Learning

yanbeic

attention

cvpr2020

image-search

retrieval

Recurrent-VLN-BERT

144

Stars

28

Forks

Watchers

Code of the CVPR 2021 Oral paper: A Recurrent Vision-and-Language BERT for Navigation

YicongHong

bert

cvpr-oral

cvpr2021

pre-trained-model

calvin

275

Stars

44

Forks

Watchers

CALVIN - A benchmark for Language-Conditioned Policy Learning for Long-Horizon Robot Manipulation Tasks

mees

computer-vision

deep-learning

grounding

manipulation