Upload folder using huggingface_hub

Browse files

Files changed (12) hide show

.gitattributes +9 -35
README.md +115 -0
Wiedervereinigung-7b-dpo-Q3_K_L.gguf +3 -0
Wiedervereinigung-7b-dpo-Q3_K_M.gguf +3 -0
Wiedervereinigung-7b-dpo-Q3_K_S.gguf +3 -0
Wiedervereinigung-7b-dpo-Q4_K_M.gguf +3 -0
Wiedervereinigung-7b-dpo-Q4_K_S.gguf +3 -0
Wiedervereinigung-7b-dpo-Q5_K_M.gguf +3 -0
Wiedervereinigung-7b-dpo-Q5_K_S.gguf +3 -0
Wiedervereinigung-7b-dpo-Q6_K.gguf +3 -0
Wiedervereinigung-7b-dpo-Q8_0.gguf +3 -0
Wiedervereinigung-7b.png +0 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,9 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+Wiedervereinigung-7b-dpo-Q3_K_L.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q3_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text
+Wiedervereinigung-7b-dpo-Q8_0.gguf filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,115 @@

+---
+tags:
+- merge
+- mergekit
+- lazymergekit
+- DiscoResearch/DiscoLM_German_7b_v1
+- DRXD1000/Phoenix
+- VAGOsolutions/SauerkrautLM-7b-v1-mistral
+- malteos/hermeo-7b
+base_model:
+- DiscoResearch/DiscoLM_German_7b_v1
+- DRXD1000/Phoenix
+- VAGOsolutions/SauerkrautLM-7b-v1-mistral
+- malteos/hermeo-7b
+license: apache-2.0
+language:
+- de
+- en
+---
+# Wiedervereinigung-7b-dpo
+![image/png](https://huggingface.co/mayflowergmbh/Wiedervereinigung-7b/resolve/main/Wiedervereinigung-7b.png)
+This is a dpo aligned merge of multiple german models scoring 7.1 on the mt-bench-de average.
+It is a merge of the best german 7B models with 7b parameters as a dare_ties merge.
+Since the original models based on mistral - three of them on the brilliant german LeoLM/leo-mistral-hessianai-7b - they are reunited in this merged model.
+Therefore the name, no nationalist ideas involved. To improve result quality they are dpo-trained with a german translation of intel-orca-dpo
+using our german fork of [LLaMA-Factory](https://github.com/mayflower/LLaMA-Factory-de).
+## mt-bench-de
+Is the merged model good? Well, of course. But it is even better with the help of some dpo tuning.
+```json
+{
+    "first_turn": 7.3,
+    "second_turn": 6.925,
+    "categories": {
+        "writing": 8.425,
+        "roleplay": 8.6,
+        "reasoning": 5.4,
+        "math": 4.35,
+        "coding": 4.3,
+        "extraction": 7.975,
+        "stem": 8.5,
+        "humanities": 9.35
+    },
+    "average": 7.1125
+}
+```
+Wiedervereinigung-7b itself is a  [LazyMergekit](https://colab.research.google.com/drive/1obulZ1ROXHjYLn6PPZJwRR6GzgQogxxb?usp=sharing) merge of:
+* [DiscoResearch/DiscoLM_German_7b_v1](https://huggingface.co/DiscoResearch/DiscoLM_German_7b_v1)
+* [DRXD1000/Phoenix](https://huggingface.co/DRXD1000/Phoenix)
+* [VAGOsolutions/SauerkrautLM-7b-v1-mistral](https://huggingface.co/VAGOsolutions/SauerkrautLM-7b-v1-mistral)
+* [malteos/hermeo-7b](https://huggingface.co/malteos/hermeo-7b)
+All the actual heavylifting has been done by the creators of these models.
+## 🧩 Configuration
+```yaml
+models:
+  - model: LeoLM/leo-mistral-hessianai-7b
+    # No parameters necessary for base model
+  - model: DiscoResearch/DiscoLM_German_7b_v1
+    parameters:
+      density: 0.6
+      weight: 0.25
+  - model: DRXD1000/Phoenix
+    parameters:
+      density: 0.6
+      weight: 0.25
+  - model: VAGOsolutions/SauerkrautLM-7b-v1-mistral
+    parameters:
+      density: 0.6
+      weight: 0.25
+  - model: malteos/hermeo-7b
+    parameters:
+      density: 0.6
+      weight: 0.25
+merge_method: dare_ties
+base_model: LeoLM/leo-mistral-hessianai-7b
+parameters:
+  int8_mask: true
+dtype: bfloat16
+```
+## 💻 Usage
+```python
+!pip install -qU transformers accelerate
+from transformers import AutoTokenizer
+import transformers
+import torch
+model = "mayflowergmbh/Wiedervereinigung-7b-dpo"
+messages = [{"role": "user", "content": "Was ist ein deutsches large language model?"}]
+tokenizer = AutoTokenizer.from_pretrained(model)
+prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+pipeline = transformers.pipeline(
+    "text-generation",
+    model=model,
+    torch_dtype=torch.float16,
+    device_map="auto",
+)
+outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
+print(outputs[0]["generated_text"])
+```

Wiedervereinigung-7b-dpo-Q3_K_L.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:225da109d73caef6b3c6c5c03e89b8bb717eead81cc7076d2500ac5e89f30b3d
+size 3822024352

Wiedervereinigung-7b-dpo-Q3_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1fe08cdde4d79136ab083398c2d8e7853fe2b733c7279b9ac52a45a6399469af
+size 3518985888

Wiedervereinigung-7b-dpo-Q3_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f9a1aed418c6485e6070bcf61235df5a8739dc0b346735a7869377338871acc
+size 3164567200

Wiedervereinigung-7b-dpo-Q4_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ace414478b0154f13f9a7510e37d6090bd09c2c144113829f6d2cc6166b0f060
+size 4368438944

Wiedervereinigung-7b-dpo-Q4_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97e300b696949c43858fe27fb9c5bf21a932459d0d3f50c14f6c3b7e10027480
+size 4140373664

Wiedervereinigung-7b-dpo-Q5_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9496dbb9eacc5480e1600b1232251c4fa3f47220972142248aa618a09d86b40
+size 5131409056

Wiedervereinigung-7b-dpo-Q5_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e515f188a80d51651beced552074908b625bc0b6167e5063309551225488f538
+size 4997715616

Wiedervereinigung-7b-dpo-Q6_K.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1da3e9cfce8b579951e719e219964517f65c680f167ae66ef04ee9a484139537
+size 5942064800

Wiedervereinigung-7b-dpo-Q8_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:953420c652ddad11ebb88c0f6b1d8cab8b33f8ee521b8caf05b92efaf95317a7
+size 7695857312

Wiedervereinigung-7b.png ADDED Viewed