README.md · Symato/Qwen2.5-7B-Instruct__trimm_vocab at 6c79d331b1b563e9ce7d6d15918572bec639b6f9

metadata

language:
  - vi
base_model:
  - Qwen/Qwen2.5-7B-Instruct

Các kỹ thuật cắt tỉa vocab (cấm nói các ngôn ngữ không muốn)

mixed data training: kết hợp cải thiện tiếng Việt, cải thiện song ngữ Anh <=> Việt, và QA/RAG trong một lần huấn luyện. (xem data/final_finetune1.jsonl.xz)

1G text, 5 epochs, sẽ release toàn bộ epoch để test riêng và merge nếu muốn.

https://github.com/symato/physics_of_llms

Thảo luận ở https://discord.com/channels/1070551652341403769/1291645458841600051

python3 model_chat.py