FoundationVision

Results 6 repositories owned by


                                            FoundationVision

GLEE

1.0k

Stars

Forks

Watchers

[CVPR2024 Highlight]GLEE: General Object Foundation Model for Images and Videos at Scale

FoundationVision

foundation-model

object-detection

open-world

tracking

UniRef

233

Stars

Forks

Watchers

[ICCV2023] Segment Every Reference Object in Spatial and Temporal Spaces

FoundationVision

object-segmentation

unified-model

[NeurIPS 2024 Oral][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultra-simp...

FoundationVision

auto-regressive-model

diffusion-models

image-generation

transformers

GenerateU

128

Stars

Forks

Watchers

[CVPR2024] Generative Region-Language Pretraining for Open-Ended Object Detection

FoundationVision

mllm

multimodality

object-detection

open-vocabulary

Groma

543

Stars

Forks

Watchers

[ECCV2024] Grounded Multimodal Large Language Model with Localized Visual Tokenization

FoundationVision

foundation-models

grounding

large-language-models

llama

LlamaGen

1.2k

Stars

Forks

Watchers

Autoregressive Model Beats Diffusion: 🦙 Llama for Scalable Image Generation

FoundationVision

FoundationVision

GLEE

UniRef

VAR

GenerateU

Groma

LlamaGen