Ce Ge's picture

3 1

Ce Ge

drcege

·

https://sites.google.com/view/drcege/

drcege

AI & ML interests

None yet

Organizations

drcege's activity

upvoted a paper 7 months ago

Data Mixing Made Efficient: A Bivariate Scaling Law for Language Model Pretraining

Paper • 2405.14908 • Published May 23 • 11