tsavage68
/

v1_1000_STEPS_1e6_rate_05_beta_DPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

v1_1000_STEPS_1e6_rate_05_beta_DPO / final_checkpoint

1 contributor

History: 1 commit

tsavage68's picture

End of training

6982f12 verified 8 months ago