Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2406.07496

about 21 hours ago

PRDP: Proximal Reward Difference Prediction for Large-Scale Reward Finetuning of Diffusion Models

Paper • 2402.08714 • Published Feb 13 • 10
Data Engineering for Scaling Language Models to 128K Context

Paper • 2402.10171 • Published Feb 15 • 18
RLVF: Learning from Verbal Feedback without Overgeneralization

Paper • 2402.10893 • Published Feb 16 • 10
Coercing LLMs to do and reveal (almost) anything

Paper • 2402.14020 • Published Feb 21 • 12

DSPy Assertions: Computational Constraints for Self-Refining Language Model Pipelines

Paper • 2312.13382 • Published Dec 20, 2023 • 3
DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines

Paper • 2310.03714 • Published Oct 5, 2023 • 28
TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published 20 days ago • 25

TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published 20 days ago • 25

TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published 20 days ago • 25

Foundation AI Papers (II)

about 12 hours ago

Iterative Reasoning Preference Optimization

Paper • 2404.19733 • Published Apr 30 • 44
Better & Faster Large Language Models via Multi-token Prediction

Paper • 2404.19737 • Published Apr 30 • 65
ORPO: Monolithic Preference Optimization without Reference Model

Paper • 2403.07691 • Published Mar 12 • 59
KAN: Kolmogorov-Arnold Networks

Paper • 2404.19756 • Published Apr 30 • 102

Language Models as Compilers: Simulating Pseudocode Execution Improves Algorithmic Reasoning in Language Models

Paper • 2404.02575 • Published Apr 3 • 46
Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing

Paper • 2404.12253 • Published Apr 18 • 51
SnapKV: LLM Knows What You are Looking for Before Generation

Paper • 2404.14469 • Published Apr 22 • 23
FlowMind: Automatic Workflow Generation with LLMs

Paper • 2404.13050 • Published Mar 17 • 32

Why do Learning Rates Transfer? Reconciling Optimization and Scaling Limits for Deep Learning

Paper • 2402.17457 • Published Feb 27
Curvature-Informed SGD via General Purpose Lie-Group Preconditioners

Paper • 2402.04553 • Published Feb 7
TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published 20 days ago • 25

Large language models for text generation

Text Diffusion with Reinforced Conditioning

Paper • 2402.14843 • Published Feb 19
LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders

Paper • 2404.05961 • Published Apr 9 • 62
TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published 20 days ago • 25

DocGraphLM: Documental Graph Language Model for Information Extraction

Paper • 2401.02823 • Published Jan 5 • 32
Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters

Paper • 2403.02677 • Published Mar 5 • 16
FlashSpeech: Efficient Zero-Shot Speech Synthesis

Paper • 2404.14700 • Published Apr 23 • 29
TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published 20 days ago • 25

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs