Jaehyun Jun's picture

Jaehyun Jun

btjhjeon

·

https://btjhjeon.github.io/

btjhjeon

AI & ML interests

Multimodal

Recent Activity

upvoted a paper about 6 hours ago

TULIP: Towards Unified Language-Image Pretraining

updated a collection about 18 hours ago

Multimodal Dataset

updated a collection about 18 hours ago

Multimodal Dataset

View all activity

Organizations

btjhjeon's activity

upvoted a paper about 6 hours ago

TULIP: Towards Unified Language-Image Pretraining

Paper • 2503.15485 • Published 1 day ago • 27

updated a collection about 18 hours ago

Multimodal Dataset

40 items • Updated about 18 hours ago • 3

upvoted a paper about 19 hours ago

Sightation Counts: Leveraging Sighted User Feedback in Building a BLV-aligned Dataset of Diagram Descriptions

Paper • 2503.13369 • Published 3 days ago • 6

updated a collection about 19 hours ago

Multimodal Dataset

40 items • Updated about 18 hours ago • 3

updated a collection 1 day ago

Multimodal Benchmarks

87 items • Updated 1 day ago • 8

upvoted 2 papers 1 day ago

PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models

Paper • 2503.12545 • Published 4 days ago • 5

Aligning Multimodal LLM with Human Preference: A Survey

Paper • 2503.14504 • Published 2 days ago • 20

updated 2 collections 1 day ago

Multimodal Alignment

16 items • Updated 1 day ago • 2

Multimodal Benchmarks

87 items • Updated 1 day ago • 8

upvoted a paper 1 day ago

MPBench: A Comprehensive Multimodal Reasoning Benchmark for Process Errors Identification

Paper • 2503.12505 • Published 4 days ago • 9

updated a collection 1 day ago

Multimodal Reasoning

20 items • Updated 1 day ago • 3

upvoted a paper 1 day ago

DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding

Paper • 2503.12797 • Published 4 days ago • 26

updated a collection 1 day ago

Multimodal Benchmarks

87 items • Updated 1 day ago • 8

upvoted a paper 1 day ago

Creation-MMBench: Assessing Context-Aware Creative Intelligence in MLLM

Paper • 2503.14478 • Published 2 days ago • 41

upvoted 2 papers 2 days ago

R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization

Paper • 2503.12937 • Published 3 days ago • 24

VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning

Paper • 2503.13444 • Published 3 days ago • 12