MIT HAN Lab

Results 41 repositories owned by


                                            MIT HAN Lab

TinyChatEngine

569

Stars

Forks

Watchers

TinyChatEngine: On-Device LLM Inference Library

mit-han-lab

arm

cpp

cuda-programming

efficientvit

1.8k

Stars

164

Forks

Watchers

EfficientViT is a new family of vision models for efficient high-resolution vision.

mit-han-lab

efficientvit

high-resolution

imagenet

segment-anything

spatten

Stars

Forks

Watchers

[HPCA'21] SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning

mit-han-lab

attention

hardware-acceleration

llm-inference

rtl

offsite-tuning

361

Stars

Forks

Watchers

Offsite-Tuning: Transfer Learning without Full Model

mit-han-lab

deep-learning

transfer-learning

distrifuser

557

Stars

Forks

Watchers

[CVPR 2024 Highlight] DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models

mit-han-lab

acceleration

diffusion-models

generative-ai

generative-model

flatformer

Stars

Forks

Watchers

[CVPR'23] FlatFormer: Flattened Window Attention for Efficient Point Cloud Transformer

mit-han-lab

llm-awq

1.6k

Stars

115

Forks

Watchers

AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration

mit-han-lab

parallel-computing-tutorial

111

Stars

Forks

Watchers

mit-han-lab

sparsevit

Stars

Forks

Watchers

[CVPR'23] SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer

mit-han-lab

streaming-llm

6.0k

Stars

346

Forks

Watchers

[ICLR 2024] Efficient Streaming Language Models with Attention Sinks

mit-han-lab