Joseph717171
/

multi_verse_model-10.7B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Joseph717171 commited on Mar 30

Commit

64a393f

•

1 Parent(s): d51c1a9

Update README.md

Files changed (1) hide show

README.md +9 -1

README.md CHANGED Viewed

@@ -4,10 +4,18 @@ library_name: transformers
 tags:
 - mergekit
 - merge
 ---
 # multi_verse_model-10.7B
 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
 ## Merge Details

 tags:
 - mergekit
 - merge
+license: apache-2.0
 ---
+# Credit for the model card's description goes to ddh0, mergekit, and, MTSAIR
 # multi_verse_model-10.7B
+This is multi_verse_model-10.7B, a depth-upscaled version of [MTSAIR/multi_verse_model](https://huggingface.co/MTSAIR/multi_verse_model).
+This model is intended to be used as a basis for further fine-tuning, or as a drop-in upgrade from the original 7 billion parameter model.
+Paper detailing how Depth-Up Scaling works:  [SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling](https://arxiv.org/abs/2312.15166)
 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
 ## Merge Details