jcmei
/

llama-3-8b-instruct-sppo-iter1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

llama-3-8b-instruct-sppo-iter1 / model-00003-of-00004.safetensors

Commit History

End of training

0f9de24
verified

jcmei commited on Oct 11