gabrielmbmb
/

smollm2-1.7B-8k-mix7-ep2-v2-qlora-r16-a16-lr3e4-mix1-dpo

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

smollm2-1.7B-8k-mix7-ep2-v2-qlora-r16-a16-lr3e4-mix1-dpo / runs /Nov05_11-27-51_ip-26-0-167-175

Commit History

End of training

ab610d7
verified

gabrielmbmb HF staff commited on 24 days ago

Model save

7deebed
verified

gabrielmbmb HF staff commited on 24 days ago

Training in progress, step 400

eb7443d
verified

gabrielmbmb HF staff commited on 24 days ago

Training in progress, step 300

0f6a009
verified

gabrielmbmb HF staff commited on 24 days ago

Training in progress, step 200

0edad2b
verified

gabrielmbmb HF staff commited on 24 days ago

Training in progress, step 100

2c8f376
verified

gabrielmbmb HF staff commited on 24 days ago