3 24 25

Xiao Xu

LooperXX

https://github.com/LooperXX

AI & ML interests

Vision-Language Learning, Large Language Model.

Recent Activity

upvoted a collection 1 day ago

Deepseek Papers

upvoted a paper about 1 month ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

upvoted a paper 2 months ago

Qwen2.5 Technical Report

View all activity

Organizations

LooperXX's activity

upvoted a collection 1 day ago

Deepseek Papers

Collection

Deepseek papers collection • 18 items • Updated 1 day ago • 131

upvoted a paper about 1 month ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 273

upvoted a paper 2 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 345

updated a model 2 months ago

LooperXX/LLaVA-OV-Manager

Updated Dec 16, 2024 • 2

authored 5 papers 2 months ago

M$^3$CoT: A Novel Benchmark for Multi-Domain Multi-step Multi-modal Chain-of-Thought

Paper • 2405.16473 • Published May 26, 2024

Self-Constructed Context Decompilation with Fined-grained Alignment Enhancement

Paper • 2406.17233 • Published Jun 25, 2024

A Two-Stage Framework with Self-Supervised Distillation For Cross-Domain Text Classification

Paper • 2304.09820 • Published Apr 18, 2023

Text is no more Enough! A Benchmark for Profile-based Spoken Language Understanding

Paper • 2112.11953 • Published Dec 22, 2021

Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models

Paper • 2412.05939 • Published Dec 8, 2024 • 16

upvoted a paper 2 months ago

Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models

Paper • 2412.05939 • Published Dec 8, 2024 • 16

commented a paper 2 months ago

Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models

Paper • 2412.05939 • Published Dec 8, 2024 • 16 •

upvoted 2 papers 3 months ago

Aguvis: Unified Pure Vision Agents for Autonomous GUI Interaction

Paper • 2412.04454 • Published Dec 5, 2024 • 62

PaliGemma 2: A Family of Versatile VLMs for Transfer

Paper • 2412.03555 • Published Dec 4, 2024 • 127

upvoted 2 papers 5 months ago

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 141

Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution

Paper • 2409.12191 • Published Sep 18, 2024 • 76

upvoted a paper 6 months ago

OLMoE: Open Mixture-of-Experts Language Models

Paper • 2409.02060 • Published Sep 3, 2024 • 78

upvoted 4 papers 7 months ago