plaguss
/

Qwen2.5-0.5B-Math-Shepherd-PRM-0.2

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-0.5B-Math-Shepherd-PRM-0.2

Commit History

Update README.md

4f4cbe1
verified

plaguss HF staff commited on 11 days ago

Update README.md

447453b
verified

plaguss HF staff commited on 11 days ago

End of training

32dbfed
verified

plaguss HF staff commited on 13 days ago

Model save

1bbb401
verified

plaguss HF staff commited on 13 days ago

Model save

ad6ce55
verified

plaguss HF staff commited on 13 days ago

Training in progress, step 1650

cd4c161
verified

plaguss HF staff commited on 13 days ago

Training in progress, step 1500

36eced5
verified

plaguss HF staff commited on 13 days ago

Training in progress, step 1000

e6bf25b
verified

plaguss HF staff commited on 13 days ago

Training in progress, step 500

e099f5f
verified

plaguss HF staff commited on 13 days ago

initial commit

ea2f60a
verified

plaguss HF staff commited on 13 days ago