FlorianJc
/

Vigostral-7b-Chat-GGUF

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Vigostral-7b-Chat-GGUF / README.md

FlorianJc's picture

Update README.md

bc1f4af over 1 year ago

|

1.51 kB

	---
	license: apache-2.0
	language:
	- fr
	pipeline_tag: text-generation
	tags:
	- mistral
	- finetuned
	- french
	- vigogne
	- text-generation-inference
	---

	# Vigostral-7b-Chat GGUF
	Conversion du modèle vigostral-7b-chat au format GGUF

	Lien du modèle original:
	https://huggingface.co/bofenghuang/vigostral-7b-chat/

	Le projet llama.cpp (pour l'inférence):
	https://github.com/ggerganov/llama.cpp/

	Les modèles ont dans leur nom un suffixe qui définit la quantification.

	La perte de qualité est tirée de la documentation de llama.cpp et a été calculée par la variation de la perplexité (ppl) sur le modèle LLaMA-v1-7B.
	Elle n'est donc fournie ici que pour donner une approximation de la perte rééle.

	\| Méthode de quantification \| Taille du fichier \| Perte \| Téléchargement \|
	\| ---- \| ---- \| ---- \| ---- \|
	\| COPY \| 13,5 Go \| Aucune \| https://huggingface.co/FlorianJc/Vigostral-7b-Chat-GGUF/blob/main/vigostral-7b-chat-COPY.gguf \|
	\| Q8_0 \| 7,2 Go \| +0.0004 ppl @ LLaMA-v1-7B \| https://huggingface.co/FlorianJc/Vigostral-7b-Chat-GGUF/blob/main/vigostral-7b-chat-Q8_0.gguf \|
	\| Q6_K \| 5,5 Go \| -0.0008 ppl @ LLaMA-v1-7B \| https://huggingface.co/FlorianJc/Vigostral-7b-Chat-GGUF/blob/main/vigostral-7b-chat-Q6_K.gguf \|
	\| Q5_K_M \| 4,8 Go \| +0.0122 ppl @ LLaMA-v1-7B \| https://huggingface.co/FlorianJc/Vigostral-7b-Chat-GGUF/blob/main/vigostral-7b-chat-Q5_K_M.gguf \|
	\| Q4_K_M \| 4,1 Go \| +0.0532 ppl @ LLaMA-v1-7B \| https://huggingface.co/FlorianJc/Vigostral-7b-Chat-GGUF/blob/main/vigostral-7b-chat-Q4_K_M.gguf \|