ds3lab (DS3Lab)

xzyao

authored a paper 4 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 53

biyuan

authored a paper 5 months ago

Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining

Paper • 2410.08102 • Published Oct 10, 2024 • 20

zhangce

authored a paper 9 months ago

Mixture-of-Agents Enhances Large Language Model Capabilities

Paper • 2406.04692 • Published Jun 7, 2024 • 58

juewang

authored a paper 9 months ago

Mixture-of-Agents Enhances Large Language Model Capabilities

Paper • 2406.04692 • Published Jun 7, 2024 • 58

xzyao

authored 2 papers 11 months ago

Aurora-M: The First Open Source Multilingual Language Model Red-teamed according to the U.S. Executive Order

Paper • 2404.00399 • Published Mar 30, 2024 • 42

DMLR: Data-centric Machine Learning Research -- Past, Present and Future

Paper • 2311.13028 • Published Nov 21, 2023 • 1

biyuan

authored a paper about 1 year ago

Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU

Paper • 2403.06504 • Published Mar 11, 2024 • 53

xzyao

authored a paper about 1 year ago

DeltaZip: Multi-Tenant Language Model Serving via Delta Compression

Paper • 2312.05215 • Published Dec 8, 2023 • 1

juewang

authored 3 papers over 1 year ago

Draft & Verify: Lossless Large Language Model Acceleration via Self-Speculative Decoding

Paper • 2309.08168 • Published Sep 15, 2023

Skill-it! A Data-Driven Skills Framework for Understanding and Training Language Models

Paper • 2307.14430 • Published Jul 26, 2023 • 3

Holistic Evaluation of Language Models

Paper • 2211.09110 • Published Nov 16, 2022

biyuan

authored a paper over 1 year ago

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

Paper • 2310.17157 • Published Oct 26, 2023 • 14

juewang

authored a paper over 1 year ago

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

Paper • 2310.17157 • Published Oct 26, 2023 • 14

juewang

updated a dataset almost 2 years ago

ds3lab/ac-sgd-arxiv21

Viewer • Updated Apr 25, 2023 • 35k • 79

xzyao

updated a dataset almost 2 years ago

ds3lab/instructions

Updated Mar 22, 2023 • 692 • 1

DS3Lab

AI & ML interests

ds3lab's activity

RedPajama: an Open Dataset for Training Large Language Models

Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining

Mixture-of-Agents Enhances Large Language Model Capabilities

Mixture-of-Agents Enhances Large Language Model Capabilities

Aurora-M: The First Open Source Multilingual Language Model Red-teamed according to the U.S. Executive Order

DMLR: Data-centric Machine Learning Research -- Past, Present and Future

Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU

DeltaZip: Multi-Tenant Language Model Serving via Delta Compression

Draft & Verify: Lossless Large Language Model Acceleration via Self-Speculative Decoding

Skill-it! A Data-Driven Skills Framework for Understanding and Training Language Models

Holistic Evaluation of Language Models

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

Deja Vu: Contextual Sparsity for Efficient LLMs at Inference Time

ds3lab/ac-sgd-arxiv21

ds3lab/instructions

AI & ML interests

Team members 4

ds3lab's activity