henchen99
/

Llama-3-3B-Open-R1-GRPO-med-cot-1k

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3-3B-Open-R1-GRPO-med-cot-1k / training_args.bin

Commit History

Training in progress, epoch 0

5801cb0
verified

henchen99 commited on 9 days ago