multimodal-generation topics

Text2Poster-ICASSP-22

203

Stars

16

Forks

Watchers

Official implementation of the ICASSP-2022 paper "Text2Poster: Laying Out Stylized Texts on Retrieved Images"

chuhaojin

aigc

artificial-neural-networks

banner-advertisements

banner-generator

UniteandConquer

34

Stars

3

Forks

Watchers

[CVPR '23] Unite and Conquer: Plug & Play Multi-Modal Synthesis using Diffusion Models

Nithin-GK

celeba-hq-dataset

diffusion-models

face-generation

face-synthesis

ContextDiff

56

Stars

3

Forks

Watchers

[ICLR 2024] Contextualized Diffusion Models for Text-Guided Image and Video Generation

YangLing0818

diffusion-models

multimodal-generation

text-to-image-generation

text-to-video

MiniGPT-5

845

Stars

52

Forks

Watchers

Official implementation of paper "MiniGPT-5: Interleaved Vision-and-Language Generation via Generative Vokens"

eric-ai-lab

diffusion-models

multimodal-generation

multimodal-llm

transformers

Awesome-LLMs-meet-Multimodal-Generation

322

Stars

17

Forks

Watchers

🔥🔥🔥 A curated list of papers on LLMs-based multimodal generation (image, video, 3D and audio).

YingqingHe

aigc

large-language-models

large-vision-language-models

multimodal-generation