lewtun
/

zephyr-7b-dpo-qlora-fix

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora-fix / README.md

Commit History

End of training

c07ba30
verified

lewtun HF staff commited on Feb 2

Model save

10b512a
verified

lewtun HF staff commited on Feb 2