bjoernp commited on
Commit
18fd888
·
1 Parent(s): 55b3d12

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +46 -2
README.md CHANGED
@@ -31,14 +31,45 @@ The model performs exceptionally well on writing, explanation and discussion tas
31
 
32
  ## Model Details
33
 
34
- - **Finetuned from:** [LeoLM/leo-hessianai-13b](https://huggingface.co/LeoLM/leo-hessianai-13b)
35
  - **Model type:** Causal decoder-only transformer language model
36
  - **Language:** English and German
37
- - **Demo:** [Continuations for 250 random prompts (TGI, 4bit nf4 quantization)](https://open-assistant.github.io/oasst-model-eval/?f=https%3A%2F%2Fraw.githubusercontent.com%2FOpen-Assistant%2Foasst-model-eval%2Fmain%2Fsampling_reports%2Foasst-sft%2F2023-08-22_OpenAssistant_llama2-70b-oasst-sft-v10_sampling_noprefix2_nf4.json%0A)
38
  - **License:** [LLAMA 2 COMMUNITY LICENSE AGREEMENT](https://huggingface.co/meta-llama/Llama-2-70b/raw/main/LICENSE.txt)
39
  - **Contact:** [LAION Discord](https://discord.com/invite/eq3cAMZtCC) or [Björn Plüster](mailto:bjoern.pl@outlook.de)
40
 
41
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
42
  ## Prompting / Prompt Template
43
 
44
  Prompt dialogue template (ChatML format):
@@ -75,6 +106,19 @@ perform safety testing and tuning tailored to their specific applications of the
75
 
76
  Please see Meta's [Responsible Use Guide](https://ai.meta.com/llama/responsible-use-guide/).
77
 
 
 
 
 
 
 
 
 
 
 
 
 
 
78
  ## Dataset Details
79
  ```
80
  ## Stats for 'Subset of OpenAssistant/OASST-DE' (3534 samples (100.0%))
 
31
 
32
  ## Model Details
33
 
34
+ - **Finetuned from:** [LeoLM/leo-hessianai-13b](https://huggingface.co/LeoLM/leo-hessianai-7b)
35
  - **Model type:** Causal decoder-only transformer language model
36
  - **Language:** English and German
37
+ - **Demo:** [Web Demo]()
38
  - **License:** [LLAMA 2 COMMUNITY LICENSE AGREEMENT](https://huggingface.co/meta-llama/Llama-2-70b/raw/main/LICENSE.txt)
39
  - **Contact:** [LAION Discord](https://discord.com/invite/eq3cAMZtCC) or [Björn Plüster](mailto:bjoern.pl@outlook.de)
40
 
41
 
42
+ ## Use in 🤗Transformers
43
+ First install direct dependencies:
44
+ ```
45
+ pip install transformers torch sentencepiece
46
+ ```
47
+ If you want faster inference using flash-attention2, you need to install these dependencies:
48
+ ```bash
49
+ pip install packaging ninja
50
+ pip install flash-attn==v2.1.1 --no-build-isolation
51
+ pip install git+https://github.com/HazyResearch/flash-attention.git@v2.1.1#subdirectory=csrc/rotary
52
+ ```
53
+ Then load the model in transformers:
54
+ ```python
55
+ from transformers import pipeline
56
+
57
+ system_prompt = """<|im_start|>system
58
+ Dies ist eine Unterhaltung zwischen einem intelligenten, hilfsbereitem KI-Assistenten und einem Nutzer.
59
+ Der Assistent gibt ausführliche, hilfreiche und ehrliche Antworten.<|im_end|>
60
+
61
+ """
62
+ prompt_format = "<|im_start|>user\n{prompt}<|im_end|>\n<|im_start|>assistant\n"
63
+ prompt = "Erkläre mir wie die Fahrradwegesituation in Hamburg ist."
64
+
65
+ generator = pipeline(model="LeoLM/leo-hessianai-13b-chat", device="cuda", torch_dtype=torch.float16, trust_remote_code=True) # True for flash-attn2 else False
66
+ print(generator(prompt_format.format(prompt=prompt), do_sample=True, top_p=0.95, max_length=8192))
67
+ ```
68
+
69
+ "*Als KI kann ich keine persönlichen Beobachtungen teilen, aber ich kann einige allgemeine Informationen zur Fahrradwegesituation in Hamburg liefern. Im Vergleich zu vielen anderen großen Städten hat Hamburg eine hohe Anzahl von Fahrradfahrern und nimmt seine Verantwortung für nachhaltige Verkehrsmittel sehr ernst. Es gibt viele Fahrradwege und separate Fahrspuren, die Radfahrern ermöglichen, zusammen mit dem Autoverkehr zu fahren. Diese Fahrradspuren sind oft mit Markierungen gekennzeichnet und durch physische Trennungen von anderen Fahrspuren abgegrenzt. Darüber hinaus gibt es viele Fahrradstraßen, auf denen Radfahrer Vorfahrt haben und Autos langsamer fahren müssen.*
70
+
71
+ *In einigen städtischen Gebieten können Fahrradwege jedoch eng oder überfüllt sein, besonders während der Stoßzeiten. Es gibt auch viele Kreuzungen, an denen Radfahrer anhalten und auf Grün warten müssen, ähnlich wie Autofahrer. Insgesamt ist die Fahrradinfrastruktur in Hamburg ziemlich gut, aber wie überall gibt es immer Raum für Verbesserungen.*"
72
+
73
  ## Prompting / Prompt Template
74
 
75
  Prompt dialogue template (ChatML format):
 
106
 
107
  Please see Meta's [Responsible Use Guide](https://ai.meta.com/llama/responsible-use-guide/).
108
 
109
+ ## Finetuning Details
110
+
111
+ | Hyperparameter | Value |
112
+ |---|---|
113
+ | Num epochs | 3 |
114
+ | Examples per epoch | 131214 |
115
+ | Global batch size | 256 |
116
+ | Learning rate | 3e-5 |
117
+ | Warmup steps | 100 |
118
+ | LR scheduler | Cosine |
119
+ | Adam betas | (0.9, 0.95) |
120
+
121
+
122
  ## Dataset Details
123
  ```
124
  ## Stats for 'Subset of OpenAssistant/OASST-DE' (3534 samples (100.0%))