Metin commited on
Commit
2f014c7
1 Parent(s): 6422798

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +179 -1
README.md CHANGED
@@ -4,4 +4,182 @@ language:
4
  - tr
5
  pipeline_tag: text-generation
6
  base_model: meta-llama/Meta-Llama-3-8B-Instruct
7
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4
  - tr
5
  pipeline_tag: text-generation
6
  base_model: meta-llama/Meta-Llama-3-8B-Instruct
7
+ ---
8
+
9
+ <img src="https://huggingface.co/Metin/LLaMA-3-8B-Instruct-TR-DPO/resolve/main/llama.png"
10
+ alt="A Llama reading a book" width="420"/>
11
+
12
+ # LLaMA-3-8B-Instruct-TR-DPO
13
+
14
+ LLaMA-3-8B-Instruct-TR-DPO is a finetuned version of [Meta-LLaMA-3-8B-Instruct](https://huggingface.co/meta-llama/meta-llama-3-8b-instruct), which has been trained on a preference dataset generated synthetically.
15
+
16
+ ## Training Info
17
+
18
+ - **Base Model**: [Meta-LLaMA-3-8B-Instruct](https://huggingface.co/meta-llama/meta-llama-3-8b-instruct)
19
+ - **Training Data**: A synthetically generated preference dataset consisting of 10K samples was used. No proprietary data was utilized.
20
+ - **Training Time**: 3 hours on a single RTX 6000 Ada
21
+
22
+ <!-- talk about the aim of the finetuning, use passive voice -->
23
+ The aim was to finetune the model to enhance the output format and content quality for the Turkish language. It is not necessarily smarter than the base model, but its outputs are more likable and preferable.
24
+
25
+ Compared to the base model, LLaMA-3-8B-Instruct-TR-DPO is more fluent and coherent in Turkish. It can generate more informative and detailed answers for a given instruction.
26
+
27
+ It should be noted that the model will still generate incorrect or nonsensical outputs, so please verify the outputs before using them.
28
+
29
+ ## How to use
30
+
31
+ You can use the below code snippet to use the model:
32
+
33
+ ```python
34
+ from transformers import BitsAndBytesConfig
35
+ import transformers
36
+ import torch
37
+
38
+ bnb_config = BitsAndBytesConfig(
39
+ load_in_4bit=True,
40
+ bnb_4bit_use_double_quant=True,
41
+ bnb_4bit_quant_type="nf4",
42
+ bnb_4bit_compute_dtype=torch.bfloat16
43
+ )
44
+
45
+ model_id = "Metin/LLaMA-3-8B-Instruct-TR-DPO"
46
+
47
+ pipeline = transformers.pipeline(
48
+ "text-generation",
49
+ model=model_id,
50
+ model_kwargs={"torch_dtype": torch.bfloat16 ,'quantization_config': bnb_config},
51
+ device_map="auto",
52
+ )
53
+
54
+ messages = [
55
+ {"role": "system", "content": "You are a helpful assistant. Always reply in Turkish."},
56
+ {"role": "user", "content": "Python'da bir öğenin bir listede geçip geçmediğini nasıl kontrol edebilirim?"},
57
+ ]
58
+
59
+ prompt = pipeline.tokenizer.apply_chat_template(
60
+ messages,
61
+ tokenize=False,
62
+ add_generation_prompt=True
63
+ )
64
+
65
+ terminators = [
66
+ pipeline.tokenizer.eos_token_id,
67
+ pipeline.tokenizer.convert_tokens_to_ids("<|eot_id|>")
68
+ ]
69
+
70
+ outputs = pipeline(
71
+ prompt,
72
+ max_new_tokens=512,
73
+ eos_token_id=terminators,
74
+ do_sample=True,
75
+ temperature=0.2,
76
+ top_p=0.9,
77
+ )
78
+
79
+ print(outputs[0]["generated_text"][len(prompt):])
80
+ ```
81
+
82
+ ## OpenLLMTurkishLeaderboard_v0.2 benchmark results
83
+
84
+ In progress...
85
+
86
+ ## Output Example (DPO Model vs Base Model)
87
+
88
+ Testing the model with a single example is not an accurate method. However, an example is provided here to showcase the model's capabilities.
89
+
90
+ ### Model: LLaMA-3-8B-Instruct-TR-DPO
91
+
92
+ #### Input
93
+
94
+ ```plaintext
95
+ Yeni bir derin öğrenme modelinin tanıtımı için bir etkinlik planı hazırla.
96
+ ```
97
+
98
+ #### Output
99
+
100
+ ```plaintext
101
+ Harika bir fikir!
102
+
103
+ Etkinlik Planı: "Deep Learning Modeli Tanıtımı"
104
+
105
+ **Adım 1: Ön-Başlangıç**
106
+
107
+ * Konuşma konusu: "Deep Learning Modeli Tanıtımı"
108
+ * Katılımcı profili: Bilimsel ve teknoloji odaklı profesyoneller, öğrenciler ve araştırmacılar
109
+ * Etkinlik süresi: 2 saat
110
+
111
+ **Adım 2: Giriş**
112
+
113
+ * Sunum: "Deep Learning Modeli Tanıtımı: Tarihçesi ve Temelleri"
114
+ * Sunum içeriği: Deep learning modelinin tarihi, temel kavramları (örneğin, ANN, CNN, RNN), uygulamaları ve avantajları
115
+ * Sunum süresi: 30 dakika
116
+
117
+ **Adım 3: Modelin Çalışma Örnekleri**
118
+
119
+ * Sunum: "Deep Learning Modelinin Çalışma Örnekleri"
120
+ * Sunum içeriği: Modelin uygulamaları (örneğin, görüntü sınıflandırma, doğal dil işleme, makine öğrenimi)
121
+ * Sunum süresi: 45 dakika
122
+
123
+ **Adım 4: Katılımcı Soruları ve Tartışma**
124
+
125
+ * Katılımcı sorularına cevap verme
126
+ * Tartışma: Modelin avantajları ve dezavantajları, uygulamaları ve gelecekteki gelişmeleri
127
+
128
+ **Adım 5: Sonuç**
129
+
130
+ * Sunum: "Deep Learning Modelinin Sonuçları"
131
+ * Sunum içeriği: Modelin sonuçları, uygulamaları ve gelecekteki gelişmeleri
132
+ * Sunum süresi: 15 dakika
133
+
134
+ **Etkinlik Notları**
135
+
136
+ * Sunumlar ve tartışmalar için gerekli malzemeleri hazırlayın
137
+ * Katılımcıların sorularına cevap verme için yeterli zaman ayırın
138
+ * Etkinlik sonrası katılımcıların geri bildirimlerini alın
139
+
140
+ Umarım bu etkinlik planı sizin için yardımcı olur!
141
+ ```
142
+
143
+ ### Model: LLaMA-3-8B-Instruct
144
+
145
+ #### Input
146
+
147
+ ```plaintext
148
+ Harika bir fikir! Aşağıdaki etkinlik planını hazırladım:
149
+
150
+ **Etkinlik Adı:** "Derin Öğrenme Modelinin Tanıtımı"
151
+
152
+ **Etkinlik Amacı:** Derin öğrenme modelinin tanıtımı ve uygulamaları hakkında bilgi sahibi olmak.
153
+
154
+ **Etkinlik Planı:**
155
+
156
+ 1. **Giriş:** Derin öğrenme modelinin tanıtımı ve önemi hakkında kısa bir konuşma.
157
+ 2. **Teorik Bölüm:** Derin öğrenme modelinin teorik temelleri ve çalışma prensipleri hakkında sunum.
158
+ 3. **Uygulama Bölüm:** Derin öğrenme modelinin uygulamaları ve başarıları hakkında sunum.
159
+ 4. **Pratik Bölüm:** Derin öğrenme modelinin pratik uygulamaları ve deneyimi hakkında sunum.
160
+ 5. **Soru-Cevap Bölüm:** Derin öğrenme modelinin sorularına cevap verme.
161
+ 6. **Sonuç Bölüm:** Derin öğrenme modelinin tanıtımı ve uygulamaları hakkında sonuç ve tavsiye.
162
+
163
+ **Etkinlik Malzemeleri:**
164
+
165
+ * Sunum araçları (slaj, powerpoint, vs.)
166
+ * Derin öğrenme modelinin uygulamaları hakkında örnekler ve grafikler
167
+ * Derin öğrenme modelinin teorik temelleri hakkında kitap ve makaleler
168
+ * Derin öğrenme modelinin pratik uygulamaları hakkında deneyimi hakkında sunum
169
+
170
+ **Etkinlik Süresi:** 2 saat
171
+
172
+ **Katılımcı Sayısı:** 20-30 kişi
173
+
174
+ **Etkinlik Yeri:** Bilimsel toplantı salonu veya online platform
175
+
176
+ **Etkinlik Tarih ve Saati:** 10:00-12:00
177
+
178
+ **Etkinlik Dili:** Türkçe
179
+
180
+ **Etkinlik Katılımcıları:** Bilimsel toplantı salonunda veya online platformda katılımcılar.
181
+
182
+ **Etkinlik Sonuçları:** Derin öğrenme modelinin tanıtımı ve uygulamaları hakkında bilgi sahibi olmak.
183
+
184
+ **Etkinlik Tavsiyesi:** Derin öğrenme modelinin tanıtımı ve uygulamaları hakkında bilgi sahibi olmak.
185
+ ```