Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2407.21783

Papers I want to read

Papers in my to-read list

RLHF Workflow: From Reward Modeling to Online RLHF

Paper • 2405.07863 • Published May 13 • 67
Chameleon: Mixed-Modal Early-Fusion Foundation Models

Paper • 2405.09818 • Published May 16 • 126
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models

Paper • 2405.15574 • Published May 24 • 53
An Introduction to Vision-Language Modeling

Paper • 2405.17247 • Published May 27 • 85

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 143
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20 • 11
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24 • 50
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24 • 44

AI Paper of the Day

A collection of papers that I think are interesting, one added each day

about 16 hours ago

Can Large Language Models Understand Context?

Paper • 2402.00858 • Published Feb 1 • 21
OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1 • 80
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 143
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity

Paper • 2401.17072 • Published Jan 30 • 25

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 105
Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 155
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125
Mistral 7B

Paper • 2310.06825 • Published Oct 10, 2023 • 47

LLM Technical Reports

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 105
Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution

Paper • 2409.12191 • Published Sep 18 • 73
Baichuan Alignment Technical Report

Paper • 2410.14940 • Published 20 days ago • 47
A Survey of Small Language Models

Paper • 2410.20011 • Published 13 days ago • 36

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 105

LLM Technical Report

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125
Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement

Paper • 2409.12122 • Published Sep 18 • 1
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

Paper • 2405.04434 • Published May 7 • 13
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5 • 69

foundation_models

Apple Intelligence Foundation Language Models

Paper • 2407.21075 • Published Jul 29 • 3
The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 105
Nemotron-4 340B Technical Report

Paper • 2406.11704 • Published Jun 17
Gemma 2: Improving Open Language Models at a Practical Size

Paper • 2408.00118 • Published Jul 31 • 73

Most interesting Papers

Gemma 2: Improving Open Language Models at a Practical Size

Paper • 2408.00118 • Published Jul 31 • 73
SAM 2: Segment Anything in Images and Videos

Paper • 2408.00714 • Published Aug 1 • 106
The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 105

2024 Papers of the year

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 105
SAM 2: Segment Anything in Images and Videos

Paper • 2408.00714 • Published Aug 1 • 106
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

Paper • 2403.09629 • Published Mar 14 • 72

Previous
1
2
3
Next

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs