Ben Pope's picture

Ben Pope

realbenpope

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 16 days ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

upvoted a paper 26 days ago

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

upvoted a paper 29 days ago

Hypencoder: Hypernetworks for Information Retrieval

View all activity

Organizations

None yet

realbenpope's activity

upvoted a paper 16 days ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published 20 days ago • 162

upvoted a paper 26 days ago

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published 28 days ago • 143

upvoted 2 papers 29 days ago

Hypencoder: Hypernetworks for Information Retrieval

Paper • 2502.05364 • Published Feb 7 • 11

LM2: Large Memory Models

Paper • 2502.06049 • Published Feb 9 • 30

upvoted 3 papers 30 days ago

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Paper • 2502.06703 • Published about 1 month ago • 142

SPARC: Subspace-Aware Prompt Adaptation for Robust Continual Learning in LLMs

Paper • 2502.02909 • Published Feb 5 • 2

Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach

Paper • 2502.05171 • Published Feb 7 • 123

upvoted 4 papers about 1 month ago

Demystifying Long Chain-of-Thought Reasoning in LLMs

Paper • 2502.03373 • Published Feb 5 • 56

Large Language Models Think Too Fast To Explore Effectively

Paper • 2501.18009 • Published Jan 29 • 23

WILDCHAT-50M: A Deep Dive Into the Role of Synthetic Data in Post-Training

Paper • 2501.18511 • Published Jan 30 • 19

Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs

Paper • 2501.18585 • Published Jan 30 • 56

upvoted 3 papers about 2 months ago

Enhancing Human-Like Responses in Large Language Models

Paper • 2501.05032 • Published Jan 9 • 50

Tensor Product Attention Is All You Need

Paper • 2501.06425 • Published Jan 11 • 84

Enabling Scalable Oversight via Self-Evolving Critic

Paper • 2501.05727 • Published Jan 10 • 70

upvoted 5 papers 2 months ago

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

Paper • 2412.18925 • Published Dec 25, 2024 • 97

OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System

Paper • 2412.20005 • Published Dec 28, 2024 • 18

Next Token Prediction Towards Multimodal Intelligence: A Comprehensive Survey

Paper • 2412.18619 • Published Dec 16, 2024 • 55

A Silver Bullet or a Compromise for Full Attention? A Comprehensive Study of Gist Token-based Context Compression

Paper • 2412.17483 • Published Dec 23, 2024 • 31

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published Dec 23, 2024 • 65

upvoted a paper 3 months ago

RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation

Paper • 2412.11919 • Published Dec 16, 2024 • 34