Myashka
/

gpt-imdb-ipo-beta_0.1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Myashka commited on Dec 9, 2023

Commit

a0f796d

•

1 Parent(s): f13a0d1

Update README.md

Files changed (1) hide show

README.md +3 -2

README.md CHANGED Viewed

@@ -14,10 +14,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [lvwerra/gpt2-imdb](https://huggingface.co/lvwerra/gpt2-imdb) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 12.0082
 - Rewards/chosen: -0.0805
 - Rewards/rejected: -0.4417
-- Rewards/accuracies: 0.8958
 - Rewards/margins: 0.3612
 - Logps/rejected: -268.1027
 - Logps/chosen: -236.0704

 This model is a fine-tuned version of [lvwerra/gpt2-imdb](https://huggingface.co/lvwerra/gpt2-imdb) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Step: 6500
+- Loss: 11.7007
 - Rewards/chosen: -0.0805
 - Rewards/rejected: -0.4417
+- Rewards/accuracies: 0.9000
 - Rewards/margins: 0.3612
 - Logps/rejected: -268.1027
 - Logps/chosen: -236.0704