plaguss
/

Mistral-7B-v0.1-Math-Shepherd-PRM-0.1

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Mistral-7B-v0.1-Math-Shepherd-PRM-0.1

Commit History

Update README.md

ca81c5c
verified

plaguss HF staff commited on Dec 4, 2024

End of training

0b92d52
verified

plaguss HF staff commited on Dec 4, 2024

Model save

b8cffca
verified

plaguss HF staff commited on Dec 4, 2024

Model save

4a6286f
verified

plaguss HF staff commited on Dec 4, 2024

Training in progress, step 1650

c64258f
verified

plaguss HF staff commited on Dec 4, 2024

Training in progress, step 1500

7c6deba
verified

plaguss HF staff commited on Dec 4, 2024

Training in progress, step 1000

11c309a
verified

plaguss HF staff commited on Dec 4, 2024

Training in progress, step 500

bb05987
verified

plaguss HF staff commited on Dec 4, 2024

initial commit

217c3ed
verified

plaguss HF staff commited on Dec 4, 2024