Ousso1117
/

GRPO-meta-Llama-3.1-8B-meta-Llama-3.1-8B-mrd3-sum

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

GRPO-meta-Llama-3.1-8B-meta-Llama-3.1-8B-mrd3-sum

1 contributor

History: 3 commits

Ousso1117's picture

Ousso1117/GRPO-meta-Llama-3.1-8B-meta-Llama-3.1-8B-mrd3-sum

c1d70a5 verified 3 days ago