thatupiso
/

SmolLM2-FT-DPO2

Text Generation

Generated from Trainer

dpo-smolK12-100

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

SmolLM2-FT-DPO2

Commit History

End of training

82a3989
verified

thatupiso commited on 23 days ago

End of training

64ac2f5
verified

thatupiso commited on 25 days ago

initial commit

32e1e93
verified

thatupiso commited on 25 days ago