token-pruning topics

Moonlit

72

Stars

7

Forks

Watchers

This is a collection of our research on efficient AI, covering hardware-aware NAS and model compression.

microsoft

inference-efficiency

model-compression

neural-architecture-search

token-pruning

LightCompress

625

Stars

62

Forks

625

Watchers

[EMNLP 2024 & AAAI 2026] A powerful toolkit for compressing large models including LLM, VLM, and video generation models.

ModelTC

benchmark

deployment

evaluation

large-language-models

vid-TLDR

52

Stars

3

Forks

52

Watchers

Official implementation of CVPR 2024 paper "vid-TLDR: Training Free Token merging for Light-weight Video Transformer".

mlvlab

computer-vision

cvpr2024

efficient-vision-transformers

token-merging

HoliTom

57

Stars

1

Forks

57

Watchers

[NeurIPS'25] HoliTom: Holistic Token Merging for Fast Video Large Language Models

cokeshao

large-language-models

llava

llava-next-video

multimodal-large-language-models

twigvlm

20

Stars

2

Forks

20

Watchers

Implementation of ICCV 2025 paper "Growing a Twig to Accelerate Large Vision-Language Models".

MILVLG

inference-acceleration

pytorch

token-pruning

vision-language-models

Awesome-Token-level-Model-Compression

183

Stars

7

Forks

183

Watchers

📚 Collection of token-level model compression resources.

xuyang-liu16

computer-vision

efficient-deep-learning

model-acceleration

model-compression