plaguss
/

Llama-3.1-8B-Math-Shepherd-PRM-0.2

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-Math-Shepherd-PRM-0.2 / README.md

Commit History

Update README.md

0994eb4
verified

plaguss HF staff commited on 25 days ago

End of training

892c05d
verified

plaguss HF staff commited on 26 days ago

Model save

bee52f5
verified

plaguss HF staff commited on 26 days ago