Mingyu Chen's picture

1

Mingyu Chen

MYC081

AI & ML interests

theory

Recent Activity

upvoted a paper 29 days ago

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

updated a model about 2 months ago

MYC081/Qwen2.5-3B-WPO-bf16-1

updated a model about 2 months ago

MYC081/Qwen2-0.5B-WPO-bf16-1

View all activity

Organizations

None yet

MYC081's activity

upvoted a paper 29 days ago

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

Paper • 2405.21046 • Published May 31, 2024 • 4