Peng's picture

11 1

Peng

BaolinPeng

·

AI & ML interests

None yet

Organizations

None yet

BaolinPeng's activity

upvoted a paper about 13 hours ago

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

Paper • 2411.11504 • Published 1 day ago • 13

upvoted a paper about 2 months ago

Improving Autonomous AI Agents with Reflective Tree Search and Self-Learning

Paper • 2410.02052 • Published Oct 2 • 9

upvoted a paper 4 months ago

On scalable oversight with weak LLMs judging strong LLMs

Paper • 2407.04622 • Published Jul 5 • 11

upvoted 2 papers 5 months ago

LiteSearch: Efficacious Tree Search for LLM

Paper • 2407.00320 • Published Jun 29 • 37

Scaling Synthetic Data Creation with 1,000,000,000 Personas

Paper • 2406.20094 • Published Jun 28 • 95

upvoted a paper 6 months ago

Matryoshka Multimodal Models

Paper • 2405.17430 • Published May 27 • 31

upvoted 2 papers 7 months ago

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published May 2 • 117

Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing

Paper • 2404.12253 • Published Apr 18 • 53

upvoted a paper 10 months ago

DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models

Paper • 2401.06066 • Published Jan 11 • 43

upvoted 2 papers about 1 year ago

AgentTuning: Enabling Generalized Agent Abilities for LLMs

Paper • 2310.12823 • Published Oct 19, 2023 • 35

Stabilizing RLHF through Advantage Model and Selective Rehearsal

Paper • 2309.10202 • Published Sep 18, 2023 • 9