audio-generation topics

AudioLDM

2.3k

Stars

215

Forks

20

Watchers

AudioLDM: Generate speech, sound effects, music and beyond, with text.

haoheliu

audio-generation

:robot: The free, Open Source alternative to OpenAI, Claude and others. Self-hosted and local-first. Drop-in replacement for OpenAI, running on consumer-grade hardware. No GPU required. Runs gguf, tr...

mudler

ai

alpaca

gpt-neox

llama

MM-Diffusion

372

Stars

22

Forks

Watchers

[CVPR'23] MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation

researchmm

audio-generation

content-creation

diffusion-models

multi-modality

AudioLDM2

2.1k

Stars

167

Forks

Watchers

Text-to-Audio/Music Generation

haoheliu

audio-generation

tango

931

Stars

70

Forks

Watchers

A family of diffusion models for text-to-audio generation.

declare-lab

audio-generation

diffusion

diffusion-models

language-models

FunCodec

362

Stars

30

Forks

Watchers

FunCodec is a research-oriented toolkit for audio quantization and downstream applications, such as text-to-speech synthesis, music generation et.al.

modelscope

audio-generation

audio-quantization

codec

encodec

Auffusion

119

Stars

11

Forks

Watchers

Official codes and models of the paper "Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation"

happylittlecat2333

audio-generation

diffusion

diffusion-models

large-language-models

im2wav

102

Stars

9

Forks

Watchers

Official implementation of the pipeline presented in I hear your true colors: Image Guided Audio Generation

RoySheffer

audio

audio-generation

image-to-audio

machine-learning

JEN-1-COMPOSER-pytorch

25

Stars

2

Forks

Watchers

Unofficial implementation JEN-1 Composer: A Unified Framework for High-Fidelity Multi-Track Music Generation(https://arxiv.org/abs/2310.19180)

0417keito

artificial-intelligence

audio

audio-generation

consistency-models

awesome-audio-plaza

344

Stars

13

Forks

Watchers

Daily tracking of awesome audio papers, including music generation, zero-shot tts, asr, audio generation

metame-ai

asr

audio-generation

awesome

awesome-music-generation