RyanYr
/

reward-judge_iter-sft-genRM_pilot-exp_iter3

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

reward-judge_iter-sft-genRM_pilot-exp_iter3

Commit History

Model save

da2d6e3
verified

RyanYr commited on 13 days ago

Training in progress, step 80

34b74c5
verified

RyanYr commited on 13 days ago

initial commit

b62bcd6
verified

RyanYr commited on 13 days ago