sardukar
/

llama13b-4bit-v2

Text Generation

Inference Endpoints

Model card Files Files and versions Community

llama13b-4bit-v2 / llama13b-4bit-ts-ao-g128-v2.safetensors

Commit History

Updated quantization for llama13b-4bit

b4f84b3

sardukar commited on Apr 8, 2023