Holarissun
/

REPROD_dpo_helpfulhelpful_gpt4_subset-1_modelgemma7b_maxsteps10000_bz8_lr5e-06

Generated from Trainer

Model card Files Files and versions Community

REPROD_dpo_helpfulhelpful_gpt4_subset-1_modelgemma7b_maxsteps10000_bz8_lr5e-06

1 contributor

History: 1 commit

Holarissun's picture

initial commit

674abfd verified 4 months ago

.gitattributes

1.52 kB

initial commit 4 months ago