mscoco topics

bottom-up-attention

1.4k

Stars

377

Forks

Watchers

Bottom-up attention model for image captioning and VQA, based on Faster R-CNN and Visual Genome

peteanderson80

caffe

captioning-images

faster-rcnn

image-captioning

coco-caption

50

Stars

42

Forks

Watchers

Adds SPICE metric to coco-caption evaluation server codes

peteanderson80

captioning-images

image-captioning

mscoco

mscoco-dataset

SPICE

130

Stars

31

Forks

Watchers

Semantic Propositional Image Caption Evaluation

peteanderson80

captioning-images

image-captioning

mscoco

Swin-Transformer

13.1k

Stars

2.0k

Forks

Watchers

This is an official implementation for "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows".

microsoft

ade20k

image-classification

imagenet

mask-rcnn

a-PyTorch-Tutorial-to-Image-Captioning

2.7k

Stars

715

Forks

Watchers

Show, Attend, and Tell | a PyTorch Tutorial to Image Captioning

sgrvinod

attention-mechanism

computer-vision

encoder-decoder

image-captioning

BMaskR-CNN

186

Stars

41

Forks

Watchers

[ECCV 2020] Boundary-preserving Mask R-CNN

hustvl

boundary-detection

detectron

detectron2

faster-rcnn

ml-cvnets

1.7k

Stars

216

Forks

Watchers

CVNets: A library for training computer vision networks

apple

ade20k

classification

computer-vision

deep-learning

CoTNet

502

Stars

75

Forks

Watchers

This is an official implementation for "Contextual Transformer Networks for Visual Recognition".

JDAI-CV

contextual-transformer

cotnet

image-classification

imagenet

EdgeNets

408

Stars

81

Forks

Watchers

This repository contains the source code of our work on designing efficient CNNs for computer vision

sacmehta

cityscapes

cnn

cnn-classification

dicenet

VarifocalNet

343

Stars

52

Forks

Watchers

VarifocalNet: An IoU-aware Dense Object Detector

hyz-xmaster

dense-object-detection

focal-loss

mscoco

object-detection