Mingyue Huo's picture

1 2

Mingyue Huo

mingyue66

mingyue66

AI & ML interests

Speech

Organizations

None yet

mingyue66's activity

upvoted a paper 4 months ago

Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning

Paper • 2407.00617 • Published Jun 30 • 7