RichardErkhov
/

abacusai_-_Dracarys2-72B-Instruct-gguf

GGUF

Model card Files Files and versions Community

RichardErkhov commited on Oct 16, 2024

Commit

5271eb4

•

1 Parent(s): b7e6437

uploaded readme

Browse files

Files changed (1) hide show

README.md +144 -0

README.md ADDED Viewed

	@@ -0,0 +1,144 @@

+Quantization made by Richard Erkhov.
+[Github](https://github.com/RichardErkhov)
+[Discord](https://discord.gg/pvy7H8DZMG)
+[Request more models](https://github.com/RichardErkhov/quant_request)
+Dracarys2-72B-Instruct - GGUF
+- Model creator: https://huggingface.co/abacusai/
+- Original model: https://huggingface.co/abacusai/Dracarys2-72B-Instruct/
+| Name | Quant method | Size |
+| ---- | ---- | ---- |
+| [Dracarys2-72B-Instruct.Q2_K.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.Q2_K.gguf) | Q2_K | 27.76GB |
+| [Dracarys2-72B-Instruct.IQ3_XS.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.IQ3_XS.gguf) | IQ3_XS | 30.59GB |
+| [Dracarys2-72B-Instruct.IQ3_S.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.IQ3_S.gguf) | IQ3_S | 32.12GB |
+| [Dracarys2-72B-Instruct.Q3_K_S.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.Q3_K_S.gguf) | Q3_K_S | 32.12GB |
+| [Dracarys2-72B-Instruct.IQ3_M.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.IQ3_M.gguf) | IQ3_M | 33.07GB |
+| [Dracarys2-72B-Instruct.Q3_K.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.Q3_K.gguf) | Q3_K | 35.11GB |
+| [Dracarys2-72B-Instruct.Q3_K_M.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.Q3_K_M.gguf) | Q3_K_M | 29.28GB |
+| [Dracarys2-72B-Instruct.Q3_K_L.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.Q3_K_L.gguf) | Q3_K_L | 36.79GB |
+| [Dracarys2-72B-Instruct.IQ4_XS.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.IQ4_XS.gguf) | IQ4_XS | 7.05GB |
+| [Dracarys2-72B-Instruct.Q4_0.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q4_0 | 38.4GB |
+| [Dracarys2-72B-Instruct.IQ4_NL.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | IQ4_NL | 38.9GB |
+| [Dracarys2-72B-Instruct.Q4_K_S.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q4_K_S | 40.88GB |
+| [Dracarys2-72B-Instruct.Q4_K.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q4_K | 44.16GB |
+| [Dracarys2-72B-Instruct.Q4_K_M.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q4_K_M | 44.16GB |
+| [Dracarys2-72B-Instruct.Q4_1.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q4_1 | 42.56GB |
+| [Dracarys2-72B-Instruct.Q5_0.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q5_0 | 46.72GB |
+| [Dracarys2-72B-Instruct.Q5_K_S.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q5_K_S | 47.85GB |
+| [Dracarys2-72B-Instruct.Q5_K.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q5_K | 50.71GB |
+| [Dracarys2-72B-Instruct.Q5_K_M.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q5_K_M | 50.71GB |
+| [Dracarys2-72B-Instruct.Q5_1.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/blob/main/Dracarys2-72B-Instruct.Q5_1.gguf) | Q5_1 | 34.61GB |
+| [Dracarys2-72B-Instruct.Q6_K.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q6_K | 59.93GB |
+| [Dracarys2-72B-Instruct.Q8_0.gguf](https://huggingface.co/RichardErkhov/abacusai_-_Dracarys2-72B-Instruct-gguf/tree/main/) | Q8_0 | 71.96GB |
+Original model description:
+---
+language:
+- en
+license: other
+tags:
+- chat
+license_name: tongyi-qianwen
+license_link: https://huggingface.co/Qwen/Qwen2.5-72B-Instruct/blob/main/LICENSE
+pipeline_tag: text-generation
+---
+# Dracarys2-72B-Instruct
+# Introduction
+We introduce the latest in the Smaug series, the Dracarys family of finetunes targeting coding performance improvements
+across a variety of base models.
+This variant is a finetune of [Qwen2.5-72B-Instruct](https://huggingface.co/Qwen/Qwen2.5-72B-Instruct)
+Compared to Qwen2.5-72B-Instruct, Dracarys has better LiveCodeBench scores (see evaluation results below).
+### Model Description
+- **Developed by:** [Abacus.AI](https://abacus.ai)
+- **License:** https://huggingface.co/Qwen/Qwen2.5-72B-Instruct/blob/main/LICENSE
+- **Finetuned from model:** [Qwen2.5-72B-Instruct](https://huggingface.co/Qwen/Qwen2.5-72B-Instruct).
+## How to use
+The prompt format is unchanged from Qwen2.5-72B-Instruct (see evaluations for prompt details for LCB)
+### Use with transformers
+See the snippet below for usage with Transformers:
+```python
+import transformers
+import torch
+model_id = "abacusai/Dracarys2-72B-Instruct"
+pipeline = transformers.pipeline(
+    "text-generation",
+    model=model_id,
+    model_kwargs={"torch_dtype": torch.bfloat16},
+    device_map="auto",
+)
+messages = [
+    {"role": "system", "content": "You are data science coding assistant that generates Python code using Pandas and Numpy."},
+    {"role": "user", "content": "Write code to select rows from the dataframe `df` having the maximum `temp` for each `city`"},
+]
+prompt = pipeline.tokenizer.apply_chat_template(
+		messages,
+		tokenize=False,
+		add_generation_prompt=True
+)
+terminators = [
+    pipeline.tokenizer.eos_token_id,
+    pipeline.tokenizer.convert_tokens_to_ids("<|eot_id|>")
+]
+outputs = pipeline(
+    prompt,
+    max_new_tokens=256,
+    eos_token_id=terminators,
+    do_sample=True,
+    temperature=0.6,
+    top_p=0.9,
+)
+print(outputs[0]["generated_text"][len(prompt):])
+```
+# Evaluation Results
+## LiveCodeBench
+| Model                      | Code Generation | Code Execution (COT) |Test Output Prediction |
+|----------------------------|-----------------|----------------------|-----------------------|
+| **Dracarys2-72B-Instruct** | **53.80**       | **89.12**            | **59.61**             |
+| Qwen2.5-72B-Instruct       | 53.03           | 88.72                | 46.28                 |
+## Breakdown of LiveCodeBench CodeGeneration
+| Model                     | Easy            | Medium         | Hard          |
+|---------------------------|-----------------|----------------|---------------|
+| **Dracarys2-72B-Instruct**| **88.79**       | **50.28**      | 9.47          |
+| Qwen2.5-72B-Instruct      |  86.99          | 49.59          | 9.99          |
+## Breakdown of LiveCodeBench TestOutputPrediction
+| Model                     | Easy            | Medium         | Hard                  |
+|---------------------------|-----------------|----------------|-----------------------|
+| **Dracarys2-72B-Instruct**| **79.25**       | **53.76**      | **37.63**             |
+| Qwen2.5-72B-Instruct      |  68.43          |  39.46         |  22.22                |