multi-modal-learning topics

A curated list of Visual Question Answering(VQA)(Image/Video Question Answering),Visual Question Generation ,Visual Dialog ,Visual Commonsense Reasoning and related area.

jokieleung

attention-networks

awesome-list

multi-modal

multi-modal-learning

nemar

165

Stars

25

Forks

Watchers

[CVPR2020] Unsupervised Multi-Modal Image Registration via Geometry Preserving Image-to-Image Translation

moabarar

affine-transformation

cnn

cvpr2020

deep-learning

awesome-vision-and-language-pretraining

54

Stars

6

Forks

Watchers

A curated list of vision-and-language pre-training (VLP). :-)

zhjohnchan

multi-modal-learning

pre-training

vision-and-language-pre-training

Deep-Learning-Framework-for-Multi-modal-Product-Classification

25

Stars

9

Forks

Watchers

Code repository for Rakuten Data Challenge: Multimodal Product Classification and Retrieval.

nlp

Chinese-CLIP

3.8k

Stars

404

Forks

Watchers

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.

clip

Yi-Min Chou, Yi-Ming Chan, Jia-Hong Lee, Chih-Yi Chiu, Chu-Song Chen, "Unifying and Merging Well-trained Deep Neural Networks for Inference Stage," International Joint Conference on Artificial Intelli...