morizon
/

llm-jp-3-13b-instruct2-grpo-R1-0225_std_step3000

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llm-jp-3-13b-instruct2-grpo-R1-0225_std_step3000

1 contributor

History: 4 commits

morizon's picture

Trained with Unsloth

0cc7d9c verified 16 days ago