comaniac
/

Meta-Llama-3-8B-Instruct-FP8-v1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

comaniac commited on May 24

Commit

1d502dc

•

1 Parent(s): 2e2c28e

Create README.md

Files changed (1) hide show

README.md +11 -0

README.md ADDED Viewed

	@@ -0,0 +1,11 @@

+## Llama-3-8B-Instruct-FP8-v1
+* Weights and activations are per-tensor quantized to float8_e4m3.
+* Quantization with AutoFP8.
+* Calibration dataset: Ultrachat (mgoin/ultrachat_2k)
+* Samples: 512
+* Sequence length: 8192
+## Evaluation
+TBA