File size: 866 Bytes
a7d6d5f
 
 
 
 
 
 
2ffac91
7c2fe75
3836c1b
 
 
d7e3575
3836c1b
0c546c4
 
 
 
 
b69de19
3836c1b
 
a7d6d5f
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
---
language:
- vi
base_model:
- Qwen/Qwen2.5-7B-Instruct
---


Các kỹ thuật cắt tỉa vocab (cấm nói các ngôn ngữ không mong muốn), ví dụ khi dịch Anh Việt model hay chèn thêm từ tiếng Trung.

**mixed data training**: kết hợp cải thiện tiếng Việt, cải thiện song ngữ Anh <=> Việt, và QA/RAG trong một lần huấn luyện. (xem data/final_finetune1.jsonl.xz)

Gần 1G text, 5 epochs, sẽ release toàn bộ epoch để test riêng và merge nếu muốn.


![image/png](https://cdn-uploads.huggingface.co/production/uploads/60c953fa9cacafb192d805fd/-w4gtwftTYXw4kOKXUiIX.png)

https://wandb.ai/tiendung/huggingface/runs/rmp30c82

Code và cách làm https://github.com/symato/physics_of_llms

Thảo luận ở https://discord.com/channels/1070551652341403769/1291645458841600051

```
python3 model_chat.py
```