Yuhui Zhang's picture

1 10 2

Yuhui Zhang

yuhuizhang

·

https://cs.stanford.edu/~yuhuiz/

AI & ML interests

ML, NLP, CV

Recent Activity

upvoted a paper 2 days ago

Video Action Differencing

liked a dataset about 2 months ago

suyc21/VMCBench

upvoted a paper about 2 months ago

Temporal Preference Optimization for Long-Form Video Understanding

View all activity

Organizations

None yet

yuhuizhang's activity

upvoted a paper 2 days ago

Video Action Differencing

Paper • 2503.07860 • Published 4 days ago • 28

upvoted 2 papers about 2 months ago

Temporal Preference Optimization for Long-Form Video Understanding

Paper • 2501.13919 • Published Jan 23 • 22

BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature

Paper • 2501.07171 • Published Jan 13 • 50

upvoted a paper 2 months ago

Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation

Paper • 2501.03225 • Published Jan 6 • 7

upvoted a paper 3 months ago

Apollo: An Exploration of Video Understanding in Large Multimodal Models

Paper • 2412.10360 • Published Dec 13, 2024 • 140

upvoted a paper 8 months ago

Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision

Paper • 2407.06189 • Published Jul 8, 2024 • 26

upvoted a paper 12 months ago

VideoAgent: Long-form Video Understanding with Large Language Model as Agent

Paper • 2403.10517 • Published Mar 15, 2024 • 35

upvoted 3 papers over 1 year ago

Beyond Positive Scaling: How Negation Impacts Scaling Trends of Language Models

Paper • 2305.17311 • Published May 27, 2023 • 1

Inverse Scaling: When Bigger Isn't Better

Paper • 2306.09479 • Published Jun 15, 2023 • 9

Describing Differences in Image Sets with Natural Language

Paper • 2312.02974 • Published Dec 5, 2023 • 16