UCLA-AGI
/

Gemma-2-9B-It-SPPO-Iter3

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

angelahzyuan commited on Jun 29, 2024

Commit

b531168

·

verified ·

1 Parent(s): 85bb300

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -32,7 +32,7 @@ This model was developed using [Self-Play Preference Optimization](https://arxiv
 |                Model                           | LC. Win Rate | Win Rate | Avg. Length |
 |-------------------------------------------|:------------:|:--------:|:-----------:|
 |[Llama-3-8B-SPPO Iter1](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter1) |48.70 |40.76 | 1669
-|[Llama-3-8B-SPPO Iter2](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter2) |- | - | -
 |[Llama-3-8B-SPPO Iter3](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter3) |**53.27** |**47.74** | 1803

 |                Model                           | LC. Win Rate | Win Rate | Avg. Length |
 |-------------------------------------------|:------------:|:--------:|:-----------:|
 |[Llama-3-8B-SPPO Iter1](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter1) |48.70 |40.76 | 1669
+|[Llama-3-8B-SPPO Iter2](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter2) |50.93 | 44.64 | 1759
 |[Llama-3-8B-SPPO Iter3](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter3) |**53.27** |**47.74** | 1803