DUAL-GPO
/

phi-2-gpo-test-longest-iter-0

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

phi-2-gpo-test-longest-iter-0 / adapter_model.safetensors

Commit History

Model save

79d9d19
verified

BraylonDash commited on Mar 21

Training in progress, step 100

de0b05c
verified

BraylonDash commited on Mar 21

Model save

a534c44
verified

BraylonDash commited on Mar 20

Model save

aa84d88
verified

BraylonDash commited on Mar 20

Model save

7648e22
verified

BraylonDash commited on Mar 20