henchen99
/

Llama-3-3B-Open-R1-GRPO-med-cot-1k

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3-3B-Open-R1-GRPO-med-cot-1k

Commit History

End of training

916bd1b
verified

henchen99 commited on 6 days ago

Model save

d24b670
verified

henchen99 commited on 6 days ago

Training in progress, epoch 0

5801cb0
verified

henchen99 commited on 6 days ago

initial commit

dddbdba
verified

henchen99 commited on 7 days ago