Yuxian Gu's picture

7 11 1

Yuxian Gu

t1101675

·

https://t1101675.github.io/

AI & ML interests

Efficient methods for language models

Recent Activity

upvoted a paper 6 days ago

Byte Latent Transformer: Patches Scale Better Than Tokens

authored a paper 14 days ago

NVILA: Efficient Frontier Visual Language Models

upvoted a paper 17 days ago

NVILA: Efficient Frontier Visual Language Models

View all activity

Organizations

t1101675's activity

upvoted a paper 6 days ago

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 10 days ago • 72

upvoted a paper 17 days ago

NVILA: Efficient Frontier Visual Language Models

Paper • 2412.04468 • Published 18 days ago • 54

upvoted 2 papers 2 months ago

MiniPLM: Knowledge Distillation for Pre-Training Language Models

Paper • 2410.17215 • Published Oct 22 • 14

Data Selection via Optimal Control for Language Models

Paper • 2410.07064 • Published Oct 9 • 8

upvoted a paper 5 months ago

Compact Language Models via Pruning and Knowledge Distillation

Paper • 2407.14679 • Published Jul 19 • 38

upvoted 2 papers 10 months ago

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

Paper • 2403.05530 • Published Mar 8 • 61

Towards Optimal Learning of Language Models

Paper • 2402.17759 • Published Feb 27 • 16

upvoted a paper about 1 year ago

An Emulator for Fine-Tuning Large Language Models using Small Language Models

Paper • 2310.12962 • Published Oct 19, 2023 • 14

upvoted 3 papers over 1 year ago

Pre-Training to Learn in Context

Paper • 2305.09137 • Published May 16, 2023 • 2

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 170

Knowledge Distillation of Large Language Models

Paper • 2306.08543 • Published Jun 14, 2023 • 20