neuralmagic
/

Llama-3.2-3B-Instruct-quantized.w8a8

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-quantized.w8a8

Commit History

Update README.md

fb5da44
verified

alexmarques commited on 5 days ago

Updated compression_config to quantization_config

59e165b
verified

mgoin commited on 12 days ago

Update README.md

0f32e45
verified

alexmarques commited on 25 days ago

Create README.md

518b068
verified

alexmarques commited on 25 days ago

Upload folder using huggingface_hub

1c42cac
verified

alexmarques commited on 26 days ago

initial commit

664ba2b
verified

alexmarques commited on 26 days ago