DUAL-GPO
/

phi-2-gpo-test-longest-iter-random2-1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

phi-2-gpo-test-longest-iter-random2-1

Commit History

End of training

3265479
verified

BraylonDash commited on Mar 27

Model save

6f885d6
verified

BraylonDash commited on Mar 27

initial commit

a7b33aa
verified

BraylonDash commited on Mar 27