multi-modal topics

A curated list of Visual Question Answering(VQA)(Image/Video Question Answering),Visual Question Generation ,Visual Dialog ,Visual Commonsense Reasoning and related area.

jokieleung

attention-networks

awesome-list

multi-modal

multi-modal-learning

DeepKE

3.5k

Stars

680

Forks

Watchers

[EMNLP 2022] An Open Toolkit for Knowledge Graph Extraction and Construction

zjunlp

attribute-extraction

bert

chinese

deep-learning

erlexec

2.8k

Stars

222

Forks

Watchers

Represent, send, store and search multimodal data

docarray

cross-modal

erlang

erlang-processes

data-structures

docarray

2.8k

Stars

222

Forks

Watchers

Represent, send, store and search multimodal data

docarray

cross-modal

erlang

erlang-processes

data-structures

valhalla

4.2k

Stars

657

Forks

Watchers

Open Source Routing Engine for OpenStreetMap

valhalla

astar

dijkstra

directions

isochrones

DALLE-pytorch

5.5k

Stars

639

Forks

Watchers

Implementation / replication of DALL-E, OpenAI's Text to Image Transformer, in Pytorch

lucidrains

artificial-intelligence

attention-mechanism

deep-learning

multi-modal

MedMNIST

987

Stars

155

Forks

Watchers

[pip install medmnist] 18x Standardized Datasets for 2D and 3D Biomedical Image Classification

MedMNIST

2d

3d

automl

benchmark

nemar

165

Stars

25

Forks

Watchers

[CVPR2020] Unsupervised Multi-Modal Image Registration via Geometry Preserving Image-to-Image Translation

moabarar

affine-transformation

cnn

cvpr2020

deep-learning

Transformer-in-Vision

1.3k

Stars

142

Forks

Watchers

Recent Transformer-based CV and related works.

DirtyHarryLYL

computer-vision

deep-learning

multi-modal

paper