yakazimir
/

qwen_cpo_entropy_0_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_cpo_entropy_0_1

Commit History

End of training

b37f9ad
verified

yakazimir commited on 26 days ago

Model save

72c8015
verified

yakazimir commited on 26 days ago

Training in progress, step 5604

b1ccc59
verified

yakazimir commited on 26 days ago

Model save

ced244c
verified

yakazimir commited on 26 days ago

Training in progress, step 5604

034cdb1
verified

yakazimir commited on 26 days ago

initial commit

0ea32e0
verified

yakazimir commited on 26 days ago