jojo1899
/

Llama-2-13b-chat-hf-ov-int4

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Llama-2-13b-chat-hf-ov-int4

1 contributor

History: 7 commits

jojo1899's picture

Improved quantization using Openvino 2024.5.0rc1

0869f09 2 months ago

.gitattributes

1.52 kB

initial commit 7 months ago
README.md

977 Bytes

Improved quantization using Openvino 2024.5.0rc1 2 months ago
config.json

801 Bytes

Improved quantization using Openvino 2024.5.0rc1 2 months ago
generation_config.json

193 Bytes

Improved quantization using Openvino 2024.5.0rc1 2 months ago
openvino_model.bin

6.71 GB
LFS

Improved quantization using Openvino 2024.5.0rc1 2 months ago
openvino_model.xml

3.16 MB

Improved quantization using Openvino 2024.5.0rc1 2 months ago
special_tokens_map.json

414 Bytes

Improved quantization using Openvino 2024.5.0rc1 2 months ago
tokenizer.json

3.62 MB

Quantized using nncf 2.13.0 2 months ago
tokenizer.model

500 kB
LFS

Improved quantization using Openvino 2024.5.0rc1 2 months ago
tokenizer_config.json

1.83 kB

Quantized using nncf 2.13.0 2 months ago