DV Lab

Results 63 repositories owned by


                                            DV Lab

Video-P2P

339

Stars

Forks

Watchers

Video-P2P: Video Editing with Cross-attention Control

dvlab-research

generative-model

image-editing

stable-diffusion

text-driven-editing

Prompt-Highlighter

123

Stars

Forks

Watchers

[CVPR 2024] Prompt Highlighter: Interactive Control for Multi-Modal LLMs

dvlab-research

llm-inference

multi-modality

text-generation

Official PyTorch implementation of MOOD series: (1) MOODv1: Rethinking Out-of-distributionDetection: Masked Image Modeling Is All You Need. (2) MOODv2: Masked Image Modeling for Out-of-Distribution...

dvlab-research

cvpr2023

masked-image-modeling

ood-detection

outlier-detection

GroupContrast

Stars

Forks

Watchers

[CVPR 2024] GroupContrast: Semantic-aware Self-supervised Representation Learning for 3D Understanding

dvlab-research

LLaMA-VID

541

Stars

Forks

Watchers

Official Implementation for LLaMA-VID: An Image is Worth 2 Tokens in Large Language Models

dvlab-research

LLMGA

449

Stars

Forks

Watchers

This project is the official implementation of 'LLMGA: Multimodal Large Language Model based Generation Assistant', ECCV2024 Oral

dvlab-research

aigc

image-design-assistant

image-editing

image-generation

Mask-Attention-Free-Transformer

Stars

Forks

Watchers

Official Implementation for "Mask-Attention-Free Transformer for 3D Instance Segmentation"

dvlab-research

MGM

3.2k

Stars

279

Forks

Watchers

Official repo for "Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models"

dvlab-research

generation

large-language-models

vision-language-model

MR-GSM8K

Stars

Forks

Watchers

Challenge LLMs to Reason About Reasoning: A Benchmark to Unveil Cognitive Depth in LLMs

dvlab-research

spconv-plus

146

Stars

Forks

Watchers

dvlab-research