Update README.md

* Added mergekit_configs for the 2 merge steps prior to the final SLERP for transparency.
* QOL: Added links to other models in card itself for fast reference

Files changed (1) hide show

README.md +47 -7

README.md CHANGED Viewed

@@ -67,13 +67,57 @@ This model was merged using the SLERP merge method.
 ### Models Merged
 The following models were included in the merge:
-* models/merliniteX-blockB1
-* models/merliniteX-blockF2
 ### Configuration
-The following YAML configuration was used to produce this model:
 ```yaml
 slices:
   - sources:
@@ -81,10 +125,6 @@ slices:
         layer_range: [0, 32]
       - model: models/merliniteX-blockB1
         layer_range: [0, 32]
-# or, the equivalent models: syntax:
-# models:
-#   - model: psmathur/orca_mini_v3_13b
-#   - model: garage-bAInd/Platypus2-13B
 merge_method: slerp
 base_model: models/merliniteX-blockF2
 parameters:

 ### Models Merged
 The following models were included in the merge:
+* [ibm/merlinite-7b](https://huggingface.co/ibm/merlinite-7b)
+* [InferenceIllusionist/Magic-Dolphin-7b](https://huggingface.co/InferenceIllusionist/Magic-Dolphin-7b)
+* [SanjiWatsuki/Kunoichi-DPO-v2-7B](https://huggingface.co/SanjiWatsuki/Kunoichi-DPO-v2-7B)
+* [mlabonne/Monarch-7B](https://huggingface.co/mlabonne/Monarch-7B)
+* [bardsai/jaskier-7b-dpo-v6.1](https://huggingface.co/bardsai/jaskier-7b-dpo-v6.1)
 ### Configuration
+The following YAML configurations were used to produce this model:
+<b>merliniteX-blockB1</b>
+```yaml
+models:
+  - model: models/merlinite-7b
+    parameters:
+      weight: 1.0
+  - model: models/Kunoichi-DPO-v2-7B
+    parameters:
+      weight: 0.2
+  - model: models/jaskier-7b-dpo-v6.1
+    parameters:
+      weight: 0.6
+  - model: models/Monarch-7b
+    parameters:
+      weight: 0.4
+merge_method: linear
+dtype: float16
+```
+<b>merliniteX-blockF2</b>
+```yaml
+slices:
+  - sources:
+      - model: models/Magic-Dolphin-7b
+        layer_range: [0, 32]
+      - model: models/jaskier-7b-dpo-v6.1
+        layer_range: [0, 32]
+merge_method: slerp
+base_model: models/Magic-Dolphin-7b
+parameters:
+  t:
+    - filter: self_attn
+      value: [0, 0.5, 0.3, 0.7, 0.5, 1]
+    - filter: mlp
+      value: [1, 0.5, 0.7, 0.3, 0.5, 0]
+    - value: 0.5 # fallback for rest of tensors
+dtype: float16
+```
+<b>merliniteX-blockH1 (Excalibur-7b)</b>
 ```yaml
 slices:
   - sources:
         layer_range: [0, 32]
       - model: models/merliniteX-blockB1
         layer_range: [0, 32]
 merge_method: slerp
 base_model: models/merliniteX-blockF2
 parameters: