GuoLiangTang's picture

3123 3

GuoLiangTang

Tommy930

·

https://github.com/TommyTang930

AI & ML interests

LLM，NLP，ML

Recent Activity

upvoted a paper 13 days ago

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

upvoted a paper 13 days ago

AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

upvoted a paper 13 days ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

View all activity

Organizations

None yet

Tommy930's activity

upvoted 17 papers 13 days ago

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

Paper • 2502.14377 • Published 14 days ago • 12

AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

Paper • 2502.14669 • Published 14 days ago • 11

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 14 days ago • 171

S*: Test Time Scaling for Code Generation

Paper • 2502.14382 • Published 14 days ago • 59

Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning

Paper • 2502.14768 • Published 14 days ago • 44

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Paper • 2502.14846 • Published 13 days ago • 13

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Paper • 2502.14282 • Published 14 days ago • 18

Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information

Paper • 2502.14258 • Published 14 days ago • 25

LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models

Paper • 2502.14834 • Published 13 days ago • 24

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 14 days ago • 127

YOLOv12: Attention-Centric Real-Time Object Detectors

Paper • 2502.12524 • Published 16 days ago • 10

TESS 2: A Large-Scale Generalist Diffusion Language Model

Paper • 2502.13917 • Published 15 days ago • 6

InfiR : Crafting Effective Small Language Models and Multimodal Small Language Models in Reasoning

Paper • 2502.11573 • Published 17 days ago • 8

Train Small, Infer Large: Memory-Efficient LoRA Training for Large Language Models

Paper • 2502.13533 • Published 15 days ago • 9

MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published 15 days ago • 31

MoM: Linear Sequence Modeling with Mixture-of-Memories

Paper • 2502.13685 • Published 15 days ago • 33

SongGen: A Single Stage Auto-regressive Transformer for Text-to-Song Generation

Paper • 2502.13128 • Published 15 days ago • 37

upvoted 3 papers 14 days ago

NExT-Mol: 3D Diffusion Meets 1D Language Modeling for 3D Molecule Generation

Paper • 2502.12638 • Published 16 days ago • 8

Thinking Preference Optimization

Paper • 2502.13173 • Published 16 days ago • 17

Is That Your Final Answer? Test-Time Scaling Improves Selective Question Answering

Paper • 2502.13962 • Published 14 days ago • 28