Barry Li

Brilliant-B

Brilliant-B

AI & ML interests

None yet

Recent Activity

upvoted a paper about 18 hours ago

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

upvoted a paper 3 days ago

Unified Reward Model for Multimodal Understanding and Generation

upvoted a paper 3 days ago

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

View all activity

Organizations

None yet

Brilliant-B's activity

upvoted a paper about 18 hours ago

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

Paper • 2503.07536 • Published 4 days ago • 73

upvoted 4 papers 3 days ago

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published 7 days ago • 104

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

Paper • 2503.06749 • Published 5 days ago • 21

Seg-Zero: Reasoning-Chain Guided Segmentation via Cognitive Reinforcement

Paper • 2503.06520 • Published 5 days ago • 9

MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning

Paper • 2503.07365 • Published 4 days ago • 53

upvoted a paper 7 days ago

LINGOLY-TOO: Disentangling Memorisation from Reasoning with Linguistic Templatisation and Orthographic Obfuscation

Paper • 2503.02972 • Published 10 days ago • 23

upvoted a paper 9 days ago

UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface

Paper • 2503.01342 • Published 11 days ago • 7

upvoted a paper 10 days ago

Visual-RFT: Visual Reinforcement Fine-Tuning

Paper • 2503.01785 • Published 11 days ago • 65

upvoted 3 papers 22 days ago

liked a model 22 days ago

Qwen/Qwen2-VL-7B-Instruct

Image-Text-to-Text • Updated Feb 6 • 1.32M • • 1.15k

liked a dataset 23 days ago

Xiaodong/open-r1-video-4k

Viewer • Updated 24 days ago • 4.66k • 264 • 4

upvoted a paper 27 days ago

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

Paper • 2501.13106 • Published Jan 22 • 85

upvoted 2 papers 29 days ago

Next Block Prediction: Video Generation via Semi-Autoregressive Modeling

Paper • 2502.07737 • Published about 1 month ago • 9

Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving

Paper • 2502.07640 • Published about 1 month ago • 8

upvoted a paper 30 days ago

Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step

Paper • 2501.13926 • Published Jan 23 • 37

upvoted 3 papers about 2 months ago

Temporal Preference Optimization for Long-Form Video Understanding

Paper • 2501.13919 • Published Jan 23 • 22

Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding

Paper • 2501.07888 • Published Jan 14 • 15

VideoRAG: Retrieval-Augmented Generation over Video Corpus

Paper • 2501.05874 • Published Jan 10 • 68