Minbyul
/

biomistral-7b-wo-kqa_golden-iter-dpo-step3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

biomistral-7b-wo-kqa_golden-iter-dpo-step3 / training_args.bin

Commit History

Model save

319f07e
verified

Minbyul commited on Jun 18

Model save

010b7d8
verified

Minbyul commited on May 10

Training in progress, step 100

edcbf9d
verified

Minbyul commited on May 10