EllieS
/

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

Commit History

End of training

f59ad98
verified

EllieS commited on Jan 18

Model save

9428d29
verified

EllieS commited on Jan 18

Training in progress, step 7000

e7d2302
verified

EllieS commited on Jan 17

Training in progress, step 5000

69322f6
verified

EllieS commited on Jan 17

Training in progress, step 1000

fd7773a
verified

EllieS commited on Jan 17

initial commit

b17b4e7
verified

EllieS commited on Jan 17