Minbyul
/

mistral-7b-dpo-full-wo-kqa_silver_wogold-ep3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mistral-7b-dpo-full-wo-kqa_silver_wogold-ep3

Commit History

End of training

351f82f
verified

Minbyul commited on Apr 11

Model save

a4205b5
verified

Minbyul commited on Apr 11

Training in progress, step 100

6cdb383
verified

Minbyul commited on Apr 11

initial commit

cb2fafa
verified

Minbyul commited on Apr 11