Minbyul
/

mistral-7b-wo-kqa_golden-iter-dpo-step2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mistral-7b-wo-kqa_golden-iter-dpo-step2

Commit History

End of training

8a9e02c
verified

Minbyul commited on May 15

Model save

a6310e0
verified

Minbyul commited on May 15

initial commit

07cc38f
verified

Minbyul commited on May 15