mandeepbagga
/

qwen-coder-0.5b-instruct-gsm8k-step-1250-grpo

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen-coder-0.5b-instruct-gsm8k-step-1250-grpo

1 contributor

History: 4 commits

mandeepbagga's picture

Trained with Unsloth

27f9260 verified 8 days ago