Hugging Face Generative AI Services (HUGS) documentation

Supported Models

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Supported Models

HUGS supports a wide range of open AI models, including LLMs, Multimodal Models, and Embedding Models. Below is a matrix of all the models supported by HUGS and the hardware they are supported on.

15 Models Supported

Model 1x NVIDIA A10G 2x NVIDIA A10G 4x NVIDIA A10G 8x NVIDIA A10G 1x NVIDIA L4 2x NVIDIA L4 4x NVIDIA L4 8x NVIDIA L4 1x NVIDIA L40S 2x NVIDIA L40S 4x NVIDIA L40S 8x NVIDIA L40S 1x NVIDIA A100 80GB 2x NVIDIA A100 80GB 4x NVIDIA A100 80GB 8x NVIDIA A100 80GB 1x NVIDIA H100 2x NVIDIA H100 4x NVIDIA H100 8x NVIDIA H100 8x AMD Instinct MI300X 2x inf2 8x inf2 24x inf2
meta-llama/Meta-Llama-3.1-8B-Instruct βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ…
meta-llama/Meta-Llama-3.1-70B-Instruct ❌ ❌ ❌ βœ… ❌ ❌ ❌ βœ… ❌ ❌ βœ… βœ… ❌ ❌ βœ… βœ… ❌ ❌ βœ… βœ… βœ… ❌ ❌ βœ…
meta-llama/Meta-Llama-3.1-405B-Instruct-FP8 ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ βœ… ❌ ❌ ❌ ❌
NousResearch/Hermes-3-Llama-3.1-8B βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ…
NousResearch/Hermes-3-Llama-3.1-70B ❌ ❌ ❌ βœ… ❌ ❌ ❌ βœ… ❌ ❌ βœ… βœ… ❌ ❌ βœ… βœ… ❌ ❌ βœ… βœ… βœ… ❌ ❌ βœ…
NousResearch/Hermes-3-Llama-3.1-405B-FP8 ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ βœ… ❌ ❌ ❌ ❌
NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO ❌ ❌ ❌ βœ… ❌ ❌ ❌ βœ… ❌ ❌ βœ… βœ… ❌ βœ… βœ… βœ… ❌ βœ… βœ… βœ… βœ… ❌ ❌ βœ…
mistralai/Mixtral-8x7B-Instruct-v0.1 ❌ ❌ ❌ βœ… ❌ ❌ ❌ βœ… ❌ ❌ βœ… βœ… ❌ βœ… βœ… βœ… ❌ βœ… βœ… βœ… βœ… ❌ ❌ βœ…
mistralai/Mistral-7B-Instruct-v0.3 βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ…
mistralai/Mixtral-8x22B-Instruct-v0.1 ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ βœ… ❌ ❌ ❌ βœ… ❌ ❌ ❌ βœ… βœ… ❌ ❌ βœ…
google/gemma-2-27b-it ❌ ❌ βœ… βœ… ❌ ❌ βœ… βœ… ❌ βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… ❌ ❌ ❌
google/gemma-2-9b-it βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… ❌ ❌ ❌
Qwen/Qwen2.5-7B-Instruct βœ… βœ… βœ… ❌ βœ… βœ… βœ… ❌ βœ… βœ… βœ… ❌ βœ… βœ… βœ… ❌ βœ… βœ… βœ… ❌ ❌ ❌ ❌ ❌
meta-llama/Llama-3.2-11B-Vision-Instruct βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… βœ… ❌ ❌ ❌ ❌
meta-llama/Llama-3.2-90B-Vision-Instruct ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ ❌ βœ… ❌ ❌ βœ… βœ… ❌ ❌ βœ… βœ… ❌ ❌ ❌ ❌

Last Updated: 2024-11-28

< > Update on GitHub