Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

TonyL's picture

TonyL

TonyMou

TonyMou

AI & ML interests

None yet

Organizations

None yet

Collections 2

LLM Compression

Quantization、Prunning、Distillation

EfficientQAT: Efficient Quantization-Aware Training for Large Language Models

Paper • 2407.11062 • Published Jul 10 • 8
PrefixQuant: Static Quantization Beats Dynamic through Prefixed Outliers in LLMs

Paper • 2410.05265 • Published Oct 7 • 29
OmniQuant: Omnidirectionally Calibrated Quantization for Large Language Models

Paper • 2308.13137 • Published Aug 25, 2023 • 17

VLM Token Compression

An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models

Paper • 2403.06764 • Published Mar 11 • 25
TokenPacker: Efficient Visual Projector for Multimodal LLM

Paper • 2407.02392 • Published Jul 2 • 21
DiffRate : Differentiable Compression Rate for Efficient Vision Transformers

Paper • 2305.17997 • Published May 29, 2023

models

None public yet

datasets

None public yet

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs