catid
/

cat-llama-3-70b-awq-q256-w4-gemm

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

cat-llama-3-70b-awq-q256-w4-gemm

1 contributor

History: 3 commits

catid's picture

add model

8a611a0 7 months ago