ISTA-DASLab
/

Mistral-7B-Instruct-v0.2-AQLM-2Bit-2x8

Update README.md

7f3acf3 verified 7 months ago

518 Bytes

metadata

library_name: transformers
tags:
  - mistral
  - finetuned
  - conversational
  - text-generation-inference

For this quantization, we used 2 codebooks of 8 bits.

Results:

Model	Quantization	MMLU (5-shot)	Model size, Gb
mistralai/Mistral-7B-Instruct-v0.2	None	0.5912	14.5
	2x8	0.4384	2.3