Yang Yue's picture

18 16

Yang Yue

yueyang2000

yueyang2000

AI & ML interests

None yet

Organizations

None yet

yueyang2000's activity

upvoted 3 papers 3 months ago

Building and better understanding vision-language models: insights and future directions

Paper • 2408.12637 • Published Aug 22 • 118

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

Paper • 2408.11039 • Published Aug 20 • 56

Achieving Human Level Competitive Robot Table Tennis

Paper • 2408.03906 • Published Aug 7 • 26

upvoted 2 papers 7 months ago

KAN: Kolmogorov-Arnold Networks

Paper • 2404.19756 • Published Apr 30 • 108

InternLM-XComposer2-4KHD: A Pioneering Large Vision-Language Model Handling Resolutions from 336 Pixels to 4K HD

Paper • 2404.06512 • Published Apr 9 • 29

upvoted 4 papers 8 months ago

When Do We Not Need Larger Vision Models?

Paper • 2403.13043 • Published Mar 19 • 25

GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection

Paper • 2403.03507 • Published Mar 6 • 182

ShortGPT: Layers in Large Language Models are More Redundant Than You Expect

Paper • 2403.03853 • Published Mar 6 • 62

Enhancing Vision-Language Pre-training with Rich Supervisions

Paper • 2403.03346 • Published Mar 5 • 14

upvoted a paper 9 months ago

Subobject-level Image Tokenization

Paper • 2402.14327 • Published Feb 22 • 17

upvoted 2 papers 10 months ago

Towards Conversational Diagnostic AI

Paper • 2401.05654 • Published Jan 11 • 16

Denoising Vision Transformers

Paper • 2401.02957 • Published Jan 5 • 28

upvoted 2 papers 11 months ago

Weak-to-Strong Generalization: Eliciting Strong Capabilities With Weak Supervision

Paper • 2312.09390 • Published Dec 14, 2023 • 32

Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models

Paper • 2312.04410 • Published Dec 7, 2023 • 14

upvoted 4 papers over 1 year ago

Measuring Faithfulness in Chain-of-Thought Reasoning

Paper • 2307.13702 • Published Jul 17, 2023 • 27

CLIPA-v2: Scaling CLIP Training with 81.1% Zero-shot ImageNet Accuracy within a \10,000 Budget; An Extra 4,000 Unlocks 81.8% Accuracy

Paper • 2306.15658 • Published Jun 27, 2023 • 12

From Word Models to World Models: Translating from Natural Language to the Probabilistic Language of Thought

Paper • 2306.12672 • Published Jun 22, 2023 • 26

TryOnDiffusion: A Tale of Two UNets

Paper • 2306.08276 • Published Jun 14, 2023 • 73