plaguss
/

Qwen2.5-0.5B-Math-Shepherd-PRM-0.1

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-0.5B-Math-Shepherd-PRM-0.1

Commit History

End of training

1acf85b
verified

plaguss HF staff commited on Dec 3, 2024

Model save

8198c8b
verified

plaguss HF staff commited on Dec 3, 2024

Model save

201664e
verified

plaguss HF staff commited on Dec 3, 2024

Training in progress, step 1650

342f157
verified

plaguss HF staff commited on Dec 3, 2024

Training in progress, step 1500

9da51b8
verified

plaguss HF staff commited on Dec 3, 2024

Training in progress, step 1000

2c1ac16
verified

plaguss HF staff commited on Dec 3, 2024

Training in progress, step 500

13c84ac
verified

plaguss HF staff commited on Dec 3, 2024

initial commit

34b579f
verified

plaguss HF staff commited on Dec 3, 2024