10086 14 206

Tien Dung

tiendung

tiendung

AI & ML interests

None yet

Recent Activity

liked a model 11 days ago

BAAI/bge-large-zh-v1.5

liked a Space about 2 months ago

Qwen/QVQ-72B-preview

updated a Space 3 months ago

Symato/tomtat

View all activity

Organizations

Posts 1

Post

1202

ICML 2024 Tutorial: Physics of Language Models
https://www.youtube.com/watch?v=yBL7J0kgldU
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction (2309.14316)

Series bài nói về việc hiểu cách LLM hoạt động. Rất thú vị, họ làm thí nghiệm kiểm soát 100% cách huấn luyện model và phát hiện rằng nếu pretrain không chứa dạng dữ liệu extraction (QA instruction, hoặc các dạng dữ liệu mà tác giả gọi là knowledge augmentation) thì mặc dù có qua instruct finetune thì LLM cũng không thể học skill knowledge extraction. => đặt lại câu hỏi liệu cách pretrain rồi mới SFT như hiện tại đã thực sự tốt chưa?

Họ đã thử vài trăm thí nghiệm với các loại kiến trúc mô hình, độ to nhỏ, ... và đều ra kết quả như nhau.

KNOWLEDGE AUGMENTATION (data augmentation)
Nếu bạn không mix instruct data với pre-train data (mix training) tốt nhất hãy áp dụng knowledge augmentation. Tức là cùng một câu đó nhưng diễn tả lại bằng nhiều cách khác nhau.

KNOWLEDGE MANIPULATION
ví dụ giả sử đã biết (đc huấn luyện) tiểu sử của A (bao gồm ngày tháng năm sinh) và hỏi A sinh tháng chẵn hay lẻ (50% cơ hội trả lời đúng). Nếu không sử dụng CoT (gợi nhớ lại kiến thức, xem A sinh tháng mấy) thì kết quả là model không làm được. => CoT (gợi nhớ kiến thức đã học) rất quan trọng với knowledge manipulation (phân loại, so sánh, xếp hạng ...)

View all Posts

Articles 2

Article

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

View all Articles

Collections 3

models 16

datasets 3

tiendung/cc-vi_truyen-filters

Preview • Updated Oct 3, 2023 • 3

tiendung/cc-vi_domains

Updated Sep 21, 2023

tiendung/chai

Viewer • Updated Sep 15, 2023 • 70.8k • 41

Tien Dung

AI & ML interests

Recent Activity

Organizations

Posts 1

Articles 2

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

Collections 3

PROMPT++

arcee-ai/The-Tome

migtissera/Synthia-v1.5-I

Gryphe/ChatGPT-4o-Writing-Prompts

PawanKrd/gpt-4o-200k

models 16

tiendung/gemma-2-9b__extend_vocab

tiendung/gemma2reranking

tiendung/bge-reranking-m3_bf16

tiendung/bge-embedding-m3_bf16

tiendung/gemma2embedding

tiendung/gemma1reranking

tiendung/cc-vi_segdedup

tiendung/pygmalion-6b-20-percent-soda_2e_merged

tiendung/open_llama_3b-8k_visyll

tiendung/tiny_starcoder_py-vi06

datasets 3

tiendung/cc-vi_truyen-filters

tiendung/cc-vi_domains

tiendung/chai

Tien Dung

AI & ML interests

Recent Activity

Organizations

Posts 1

Articles 2

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

Collections 3

PROMPT++

models 16 Sort: Recently updated

datasets 3 Sort: Recently updated

models 16

datasets 3