ShenaoZ
/

0.001_idpo_same_scratch_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.001_idpo_same_scratch_iter_2

1 contributor

History: 6 commits

ShenaoZ's picture

End of training

1814e5e verified 10 months ago