reasoning-agentic - a sheikhjubair Collection

sheikhjubair 's Collections

reasoning-agentic

Data-Training and Eval

reasoning-agentic

updated Jan 2

OpenAI o1 System Card

Paper • 2412.16720 • Published Dec 21, 2024 • 31
LearnLM: Improving Gemini for Learning

Paper • 2412.16429 • Published Dec 21, 2024 • 22
NILE: Internal Consistency Alignment in Large Language Models

Paper • 2412.16686 • Published Dec 21, 2024 • 8
Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published Dec 20, 2024 • 38
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 345
AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling

Paper • 2412.15084 • Published Dec 19, 2024 • 13
Xmodel-2 Technical Report

Paper • 2412.19638 • Published Dec 27, 2024 • 25