multimodal topic

List multimodal repositories

CoCa-pytorch

990

Stars

88

Forks

Watchers

Implementation of CoCa, Contrastive Captioners are Image-Text Foundation Models, in Pytorch

artificial-intelligence

attention-mechanism

contrastive-learning

mmf

5.4k

Stars

922

Forks

Watchers

A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)

facebookresearch

erlexec

2.8k

Stars

222

Forks

Watchers

Represent, send, store and search multimodal data

erlang-processes

data-structures

docarray

2.8k

Stars

222

Forks

Watchers

Represent, send, store and search multimodal data

erlang-processes

data-structures

CLIP4Clip

792

Stars

116

Forks

Watchers

An official implementation for "CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval"

DALLE-mtf

435

Stars

48

Forks

Watchers

Open-AI's DALL-E for large scale training in mesh-tensorflow.

artificial-intelligence

clip-guided-diffusion

448

Stars

62

Forks

Watchers

A CLI tool/python module for generating images from text using guided diffusion and CLIP from OpenAI.

artificial-intelligence

image-generation

discoart

3.8k

Stars

246

Forks

Watchers

🪩 Create Disco Diffusion artworks in one line

clip-guided-diffusion

mmt

249

Stars

40

Forks

Watchers

Multi-Modal Transformer for Video Retrieval

PathomicFusion

257

Stars

77

Forks

Watchers

Fusing Histology and Genomics via Deep Learning - IEEE TMI

computational-pathogenomics

OMML

555

Stars

98

Forks

Watchers

Multi-Modal learning toolkit based on PaddlePaddle and PyTorch, supporting multiple applications such as multi-modal classification, cross-modal retrieval and image caption.

crossmodal-retrieval

imagecaptioning