cybershiptrooper
/

grpo-hybrid-RM-epochs-100-JGdxMs7cWW-probe_layers-10_12_16_20

Model card Files Files and versions Metrics Training metrics Community

grpo-hybrid-RM-epochs-100-JGdxMs7cWW-probe_layers-10_12_16_20 / config.json

Commit History

Training in progress, step 50

d499309
verified

cybershiptrooper commited on 2 days ago