huseinzol05
commited on
Commit
•
f6557ef
1
Parent(s):
8dca936
Update README.md
Browse files
README.md
CHANGED
@@ -7,4 +7,29 @@ language:
|
|
7 |
|
8 |
README at https://github.com/huseinzol05/malaya/tree/master/session/llama3
|
9 |
|
10 |
-
WandB, https://wandb.ai/huseinzol05/finetune-llama-3-8b/workspace?nw=nwuserhuseinzol05
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
|
8 |
README at https://github.com/huseinzol05/malaya/tree/master/session/llama3
|
9 |
|
10 |
+
WandB, https://wandb.ai/huseinzol05/finetune-llama-3-8b/workspace?nw=nwuserhuseinzol05
|
11 |
+
|
12 |
+
## how-to
|
13 |
+
|
14 |
+
```python
|
15 |
+
from transformers import AutoTokenizer, AutoModelForCausalLM
|
16 |
+
import torch
|
17 |
+
|
18 |
+
tokenizer = AutoTokenizer.from_pretrained('mesolitica/llama-3-8b-8192-hf')
|
19 |
+
model = AutoModelForCausalLM.from_pretrained('mesolitica/llama-3-8b-8192-hf', torch_dtype=torch.bfloat16,
|
20 |
+
use_flash_attention_2 = True)
|
21 |
+
_ = model.cuda()
|
22 |
+
t = tokenizer('User: KWSP tu apa?\nBot: ', return_tensors = 'pt').to('cuda')
|
23 |
+
r = model.generate(**t, max_new_tokens=200,
|
24 |
+
top_p=0.95,
|
25 |
+
top_k=50,
|
26 |
+
temperature=0.9,
|
27 |
+
do_sample=True,
|
28 |
+
num_beams=1,)
|
29 |
+
tokenizer.decode(r[0])
|
30 |
+
```
|
31 |
+
|
32 |
+
```
|
33 |
+
User: KWSP tu apa?
|
34 |
+
Bot: ialah kumpulan wang simpanan pekerja kita sebagai badan kebajikan yang memastikan kesejahteraan 13.5 juta ahlinya terus terbela. 2) Pengeluaran i-sinar akan diteruskan dengan bayaran pertama 3) Pengeluaran i-citra akan diteruskan dengan bayaran pertama bulan April 2021. 4) 600,000 orang telah memohon untuk pengeluaran i-lestari daripada jumlah yang layak iaitu 2.5 juta orang. 5) KWSP telah meningkatkan had pengeluaran i-lestari daripada 6,000 kepada 9,000 bagi 6) Peratusan pengeluaran i-lestari turut dinaikkan daripada 4% kepada 10% iaitu maksimum pengeluaran RM
|
35 |
+
```
|