End of training

Files changed (7) hide show

README.md CHANGED Viewed

@@ -15,10 +15,10 @@ should probably proofread and complete it, then remove this comment. -->
 # ubot
-This model is a fine-tuned version of [bert-base-multilingual-cased](https://huggingface.co/bert-base-multilingual-cased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0019
-- Accuracy: 0.9995
 ## Model description
@@ -37,23 +37,20 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.1538        | 1.0   | 684  | 0.0461          | 0.9895   |
-| 0.0552        | 2.0   | 1368 | 0.0288          | 0.9940   |
-| 0.0411        | 3.0   | 2052 | 0.0166          | 0.9971   |
-| 0.0251        | 4.0   | 2736 | 0.0083          | 0.9983   |
-| 0.0209        | 5.0   | 3420 | 0.0019          | 0.9995   |
 ### Framework versions
@@ -61,4 +58,4 @@ The following hyperparameters were used during training:
 - Transformers 4.35.2
 - Pytorch 2.1.0+cu121
 - Datasets 2.16.1
-- Tokenizers 0.15.0

 # ubot
+This model is a fine-tuned version of [bert-base-multilingual-cased](https://huggingface.co/bert-base-multilingual-cased) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1478
+- Accuracy: 0.9561
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 2
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.1296        | 1.0   | 1810 | 0.1433          | 0.9536   |
+| 0.0931        | 2.0   | 3620 | 0.1478          | 0.9561   |
 ### Framework versions
 - Transformers 4.35.2
 - Pytorch 2.1.0+cu121
 - Datasets 2.16.1
+- Tokenizers 0.15.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:45f9cb194998a6e6261f77a93025eae01ec25a774ac2acefee3248ea218105fd
 size 711443456

 version https://git-lfs.github.com/spec/v1
+oid sha256:2bd9fe657f27a7c734f0caec9c3cfc78ad5655a1b70a6b18fdd4936a5d95e898
 size 711443456

runs/Jan28_21-16-59_adaffa8b1df5/events.out.tfevents.1706476620.adaffa8b1df5.1159.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9ed86824a33ce25e5beafaa486cbeaa62aa5454700d5089f02664cdb55fad23
+size 9253

runs/Jan29_01-20-52_adaffa8b1df5/events.out.tfevents.1706491252.adaffa8b1df5.1159.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2b3190cc37a9a4bd834282fd559336698956807b52b553310de65bbb451c566
+size 6648

runs/Jan29_04-14-50_adaffa8b1df5/events.out.tfevents.1706501690.adaffa8b1df5.1159.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f9da67b0fa0c30a39895521213f01b832d97a01783323fbb86b1f640aedc966
+size 6648

tokenizer.json CHANGED Viewed

@@ -6,7 +6,14 @@
     "strategy": "LongestFirst",
     "stride": 0
   },
-  "padding": null,
   "added_tokens": [
     {
       "id": 0,

     "strategy": "LongestFirst",
     "stride": 0
   },
+  "padding": {
+    "strategy": "BatchLongest",
+    "direction": "Right",
+    "pad_to_multiple_of": null,
+    "pad_id": 0,
+    "pad_type_id": 0,
+    "pad_token": "[PAD]"
+  },
   "added_tokens": [
     {
       "id": 0,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b74b0bd11c4c3371cfa3a288a13b922b22cd5714dc12e5bea2d92ccf0dcd9a5
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:06bc8541594c13291fcd1372ccb50b88966fa7285032823c7687f5fe8f7c2a0c
 size 4600