sanxialiuzhan's picture

1 3

sanxialiuzhan

sanxialiuzhan

https://aichina.me

cuntoushifu

AI & ML interests

None yet

Organizations

sanxialiuzhan's activity

upvoted a paper 1 day ago

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs

Paper • 2402.14740 • Published Feb 22 • 11