mayacinka
/

NeuralZephyr-Beagle-7B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mayacinka commited on Feb 16, 2024

Commit

0a3f56a

·

verified ·

1 Parent(s): 395e87b

Update README.md

Files changed (1) hide show

README.md +27 -0

README.md CHANGED Viewed

@@ -13,6 +13,8 @@ license: apache-2.0
 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
 ## Merge Details
 ### Merge Method
@@ -44,4 +46,29 @@ base_model: CultriX/NeuralTrix-7B-dpo
 parameters:
   int8_mask: true
 dtype: bfloat16
 ```

 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
+Code credit: [this excellent medium blog](https://medium.com/towards-data-science/merge-large-language-models-with-mergekit-2118fb392b54)
 ## Merge Details
 ### Merge Method
 parameters:
   int8_mask: true
 dtype: bfloat16
+```
+# Inference
+```python
+# pip install transformers
+from transformers import AutoTokenizer
+import transformers
+import torch
+model = "mayacinka/NeuralZephyr-Beagle-7B"
+messages = [{"role": "user", "content": "What is a large language model?"}]
+tokenizer = AutoTokenizer.from_pretrained(model)
+prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+pipeline = transformers.pipeline(
+    "text-generation",
+    model=model,
+    torch_dtype=torch.float16,
+    device_map="auto",
+)
+outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
+print(outputs[0]["generated_text"])
 ```