End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [cardiffnlp/twitter-roberta-base-2019-90m](https://huggingface.co/cardiffnlp/twitter-roberta-base-2019-90m) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.4494
 ## Model description

 This model is a fine-tuned version of [cardiffnlp/twitter-roberta-base-2019-90m](https://huggingface.co/cardiffnlp/twitter-roberta-base-2019-90m) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.4514
 ## Model description

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
     "epoch": 9.83,
-    "eval_loss": 2.5190134048461914,
-    "eval_runtime": 231.2769,
     "eval_samples": 205510,
-    "eval_samples_per_second": 888.588,
-    "eval_steps_per_second": 55.539,
-    "perplexity": 12.416340717163417,
-    "train_loss": 2.773840421549479,
-    "train_runtime": 219744.0708,
     "train_samples": 3904699,
-    "train_samples_per_second": 174.749,
-    "train_steps_per_second": 10.922
 }

 {
     "epoch": 9.83,
+    "eval_loss": 2.4514307975769043,
+    "eval_runtime": 229.7941,
     "eval_samples": 205510,
+    "eval_samples_per_second": 894.323,
+    "eval_steps_per_second": 55.898,
+    "perplexity": 11.604939165014551,
+    "train_loss": 2.5438934391276042,
+    "train_runtime": 220778.1092,
     "train_samples": 3904699,
+    "train_samples_per_second": 173.93,
+    "train_steps_per_second": 10.871
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 9.83,
-    "eval_loss": 2.5190134048461914,
-    "eval_runtime": 231.2769,
     "eval_samples": 205510,
-    "eval_samples_per_second": 888.588,
-    "eval_steps_per_second": 55.539,
-    "perplexity": 12.416340717163417
 }

 {
     "epoch": 9.83,
+    "eval_loss": 2.4514307975769043,
+    "eval_runtime": 229.7941,
     "eval_samples": 205510,
+    "eval_samples_per_second": 894.323,
+    "eval_steps_per_second": 55.898,
+    "perplexity": 11.604939165014551
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 9.83,
-    "train_loss": 2.773840421549479,
-    "train_runtime": 219744.0708,
     "train_samples": 3904699,
-    "train_samples_per_second": 174.749,
-    "train_steps_per_second": 10.922
 }

 {
     "epoch": 9.83,
+    "train_loss": 2.5438934391276042,
+    "train_runtime": 220778.1092,
     "train_samples": 3904699,
+    "train_samples_per_second": 173.93,
+    "train_steps_per_second": 10.871
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff