16 85 20

KABI

dongguanting

https://dongguanting.github.io/

AI & ML interests

Reasoning and Alignment for Large Language Models

Recent Activity

upvoted a paper 6 days ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

upvoted a paper 8 days ago

RAG-Star: Enhancing Deliberative Reasoning with Retrieval Augmented Verification and Refinement

liked a dataset 27 days ago

jinzhuoran/RAG-RewardBench

View all activity

Organizations

dongguanting's activity

upvoted a paper 6 days ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 7 days ago • 91

upvoted a paper 8 days ago

RAG-Star: Enhancing Deliberative Reasoning with Retrieval Augmented Verification and Refinement

Paper • 2412.12881 • Published Dec 17, 2024 • 2

liked a dataset 27 days ago

jinzhuoran/RAG-RewardBench

Viewer • Updated Dec 23, 2024 • 1.49k • 228 • 9

upvoted 5 papers about 1 month ago

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published Jan 8 • 258

commented a paper about 1 month ago

Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9 • 95 •

upvoted 2 papers about 1 month ago

LLM4SR: A Survey on Large Language Models for Scientific Research

Paper • 2501.04306 • Published Jan 8 • 35

URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics

Paper • 2501.04686 • Published Jan 8 • 50

liked a model about 1 month ago

Haon-Chen/speed-embedding-7b-instruct

Feature Extraction • Updated Nov 3, 2024 • 238 • 5

authored a paper about 2 months ago

Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9 • 95

commented a paper about 2 months ago

Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9 • 95 •

upvoted a paper about 2 months ago

Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9 • 95

commented a paper about 2 months ago

Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9 • 95 •

upvoted 3 papers about 2 months ago

Virgo: A Preliminary Exploration on Reproducing o1-like MLLM

Paper • 2501.01904 • Published Jan 3 • 32

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs

Paper • 2412.21187 • Published Dec 30, 2024 • 40

ProgCo: Program Helps Self-Correction of Large Language Models

Paper • 2501.01264 • Published Jan 2 • 25

commented a paper about 2 months ago

ProgCo: Program Helps Self-Correction of Large Language Models

Paper • 2501.01264 • Published Jan 2 • 25 •