End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -12,11 +12,6 @@ should probably proofread and complete it, then remove this comment. -->
 # sinhala-roman-transformer
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
-It achieves the following results on the evaluation set:
-- Loss: 8.1028
-- Rouge2 Precision: 0.0
-- Rouge2 Recall: 0.0
-- Rouge2 Fmeasure: 0.0
 ## Model description
@@ -41,14 +36,12 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 3.0
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Rouge2 Precision | Rouge2 Recall | Rouge2 Fmeasure |
-|:-------------:|:-----:|:----:|:---------------:|:----------------:|:-------------:|:---------------:|
-| 8.182         | 2.0   | 4    | 8.1028          | 0.0              | 0.0           | 0.0             |
 ### Framework versions

 # sinhala-roman-transformer
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 2000
 - num_epochs: 3.0
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions

config.json CHANGED Viewed

@@ -163,6 +163,8 @@
   "eos_token_id": 3,
   "is_encoder_decoder": true,
   "length_penalty": 2.0,
   "model_type": "encoder-decoder",
   "no_repeat_ngram_size": 3,
   "num_beams": 4,

   "eos_token_id": 3,
   "is_encoder_decoder": true,
   "length_penalty": 2.0,
+  "max_length": 142,
+  "min_length": 56,
   "model_type": "encoder-decoder",
   "no_repeat_ngram_size": 3,
   "num_beams": 4,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a52ee247a0c8efe4a594efd0d9762f3ecc619c7fcb788bde9ee7d2df546262ae
 size 132506536

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f51540746a6f3d27d5c07b72a8b6fa4b48f9fbffea353a035cd3f9b6f99fc15
 size 132506536

runs/Jun23_10-43-28_970b0707b08f/events.out.tfevents.1719139412.970b0707b08f.317.5 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:46ad872ed9e85ff61aec67f1204fba0f1511cf07326bdd8fd927da47fe268db9
-size 17431

 version https://git-lfs.github.com/spec/v1
+oid sha256:b84d194ae1f9d608f42150f82c5cbbb14c8c796365bc9b58e8f822ae1b459923
+size 18418

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:95c1b0823b88f7f1d84ef295d5dde620f76f61b4847b26c5592f1eb5be7acb4d
-size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3169c99acca6520dde776a047dc39e352627a074cef0e630de1c341aaacd1e93
+size 5304