Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2401.02385

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89
google/gemma-2-2b-it

Text Generation • Updated Aug 27 • 349k • • 573
stabilityai/stable-fast-3d

Image-to-3D • Updated Aug 2 • 6.78k • 365
mistralai/Mixtral-8x7B-Instruct-v0.1

Text Generation • Updated Aug 19 • 598k • • 4.14k

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89

meta-llama/Meta-Llama-3-8B

Text Generation • Updated 3 days ago • 1.83M • 5.7k
TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89

meta-llama/Llama-2-7b-chat

Text Generation • Updated Apr 17 • 547
TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89

Efficient Training

Rethinking Optimization and Architecture for Tiny Language Models

Paper • 2402.02791 • Published Feb 5 • 12
Specialized Language Models with Cheap Inference from Limited Domain Data

Paper • 2402.01093 • Published Feb 2 • 45
Scavenging Hyena: Distilling Transformers into Long Convolution Models

Paper • 2401.17574 • Published Jan 31 • 15
Understanding LLMs: A Comprehensive Overview from Training to Inference

Paper • 2401.02038 • Published Jan 4 • 61

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89

Transformers are Multi-State RNNs

Paper • 2401.06104 • Published Jan 11 • 34
Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM

Paper • 2401.02994 • Published Jan 4 • 47
TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89

MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24 • 49
Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads

Paper • 2401.10774 • Published Jan 19 • 53
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 141
Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding

Paper • 2401.12954 • Published Jan 23 • 28

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89
Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2 • 64
Asynchronous Local-SGD Training for Language Modeling

Paper • 2401.09135 • Published Jan 17 • 9
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

Paper • 2404.07143 • Published Apr 10 • 103

Previous
1
2
3
4
Next

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs