hkust-nlp
/

deita-7b-v1.0-sft

AndrewZeng commited on Dec 29, 2023

Commit

51c951f

•

1 Parent(s): 230e39d

Update README.md (#3)

- Update README.md (53f6961463a23966dc100cf31fb0882a60a4ec2a)

Co-authored-by: WeihaoZeng <AndrewZeng@users.noreply.huggingface.co>

Files changed (1) hide show

README.md CHANGED Viewed

@@ -10,6 +10,8 @@ language:
 # Model Card for Deita 7B V1.0 SFT
 Deita is an open-sourced project designed to facilitate **Automatic Data Selection** for instruction tuning in Large Language Models (LLMs).
 Deita 7B V1.0 SFT is a fine-tuned version of Mistral-7B-v0.1 that was trained on 6k automatically selected lightweight, high-quality alignment SFT data: [Deita 6K V0](https://huggingface.co/datasets/hkust-nlp/deita-6k-v0).
@@ -27,8 +29,6 @@ Deita 7B V1.0 SFT is a fine-tuned version of Mistral-7B-v0.1 that was trained on
 ## Performance
-<details>
-  <summary>See full evaluations</summary>
 | Model                                          | Align     | Data Size  | MT-Bench | AlpacaEval(%) | OpenLLM (Avg.) |
 |------------------------------------------------|-----------|------------|----------|---------------|----------------|
@@ -63,7 +63,7 @@ Deita 7B V1.0 SFT is a fine-tuned version of Mistral-7B-v0.1 that was trained on
 | DEITA-7B-v1.0             | SFT + DPO | 6K SFT + 10K DPO   | 7.55     | 90.06         | 69.86          |
-</details>
 ## Input Format

 # Model Card for Deita 7B V1.0 SFT
+[GitHub](https://github.com/hkust-nlp/deita) | [Paper](https://arxiv.org/abs/2312.15685)
 Deita is an open-sourced project designed to facilitate **Automatic Data Selection** for instruction tuning in Large Language Models (LLMs).
 Deita 7B V1.0 SFT is a fine-tuned version of Mistral-7B-v0.1 that was trained on 6k automatically selected lightweight, high-quality alignment SFT data: [Deita 6K V0](https://huggingface.co/datasets/hkust-nlp/deita-6k-v0).
 ## Performance
 | Model                                          | Align     | Data Size  | MT-Bench | AlpacaEval(%) | OpenLLM (Avg.) |
 |------------------------------------------------|-----------|------------|----------|---------------|----------------|
 | DEITA-7B-v1.0             | SFT + DPO | 6K SFT + 10K DPO   | 7.55     | 90.06         | 69.86          |
 ## Input Format