Chris Concannon's picture

99 17

Chris Concannon

choncan

·

AI & ML interests

None yet

Organizations

None yet

choncan's activity

upvoted 2 papers 16 days ago

What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective

Paper • 2410.23743 • Published 20 days ago • 58

GPT-4o System Card

Paper • 2410.21276 • Published 25 days ago • 79

upvoted a paper 23 days ago

Movie Gen: A Cast of Media Foundation Models

Paper • 2410.13720 • Published Oct 17 • 88

upvoted 2 papers 24 days ago

AutoTrain: No-code training for state-of-the-art models

Paper • 2410.15735 • Published 30 days ago • 57

Baichuan-Omni Technical Report

Paper • 2410.08565 • Published Oct 11 • 83

upvoted 4 papers about 1 month ago

GLEE: A Unified Framework and Benchmark for Language-based Economic Environments

Paper • 2410.05254 • Published Oct 7 • 80

Aria: An Open Multimodal Native Mixture-of-Experts Model

Paper • 2410.05993 • Published Oct 8 • 107

Differential Transformer

Paper • 2410.05258 • Published Oct 7 • 166

Addition is All You Need for Energy-efficient Language Models

Paper • 2410.00907 • Published Oct 1 • 144

upvoted 11 papers about 2 months ago

From Code to Correctness: Closing the Last Mile of Code Generation with Hierarchical Debugging

Paper • 2410.01215 • Published Oct 2 • 30

SAM 2: Segment Anything in Images and Videos

Paper • 2408.00714 • Published Aug 1 • 108

Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers

Paper • 2409.04109 • Published Sep 6 • 43

DSBench: How Far Are Data Science Agents to Becoming Data Science Experts?

Paper • 2409.07703 • Published Sep 12 • 66

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 136

OmniGen: Unified Image Generation

Paper • 2409.11340 • Published Sep 17 • 107

Seed-Music: A Unified Framework for High Quality and Controlled Music Generation

Paper • 2409.09214 • Published Sep 13 • 46

Towards a Unified View of Preference Learning for Large Language Models: A Survey

Paper • 2409.02795 • Published Sep 4 • 72

Attention Heads of Large Language Models: A Survey

Paper • 2409.03752 • Published Sep 5 • 87

WildVis: Open Source Visualizer for Million-Scale Chat Logs in the Wild

Paper • 2409.03753 • Published Sep 5 • 18

LongCite: Enabling LLMs to Generate Fine-grained Citations in Long-context QA

Paper • 2409.02897 • Published Sep 4 • 44