End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -18,11 +18,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google-t5/t5-base](https://huggingface.co/google-t5/t5-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.8421
-- Rouge1: 0.1961
-- Rouge2: 0.1049
-- Rougel: 0.1705
-- Rougelsum: 0.1707
 - Gen Len: 19.0
 ## Model description
@@ -43,8 +43,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 1
-- eval_batch_size: 1
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
@@ -55,8 +55,8 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| 2.395         | 1.0   | 989  | 1.8823          | 0.193  | 0.1042 | 0.1686 | 0.1688    | 19.0    |
-| 1.9058        | 2.0   | 1978 | 1.8421          | 0.1961 | 0.1049 | 0.1705 | 0.1707    | 19.0    |
 ### Framework versions

 This model is a fine-tuned version of [google-t5/t5-base](https://huggingface.co/google-t5/t5-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.8450
+- Rouge1: 0.1993
+- Rouge2: 0.1092
+- Rougel: 0.172
+- Rougelsum: 0.1721
 - Gen Len: 19.0
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 2
+- eval_batch_size: 2
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| No log        | 1.0   | 495  | 1.8828          | 0.1975 | 0.108  | 0.1703 | 0.1703    | 19.0    |
+| 2.3191        | 2.0   | 990  | 1.8450          | 0.1993 | 0.1092 | 0.172  | 0.1721    | 19.0    |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bc6ccfe186305df271191b4c6de49b8e07f67791ec3709806b5cf3def68be8f5
 size 891644712

 version https://git-lfs.github.com/spec/v1
+oid sha256:310641d0a728b21b039da09b65ea8606156dd767652d160c2d86f7131990627b
 size 891644712

runs/Nov18_07-29-56_e1fb2bd60964/events.out.tfevents.1731914997.e1fb2bd60964.7746.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0f44e42984bab4f7490ccfe9e7126986f143f69861e5d29198344c0c9baec5c5
+size 7770

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d36a8f82de6a42739757fdc9f5ba2f9a17557791de7167c7689d01d92baca55f
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8e7fed92c8eacc2d294ba0e0f77c5577e6e0dbb1b8c60665413101d82a0f55f
 size 5496