Model save

Browse files

Files changed (5) hide show

README.md +0 -5
config.json +35 -40
model.safetensors +2 -2
runs/Mar16_04-14-07_13e96b604141/events.out.tfevents.1710562451.13e96b604141.322.0 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,8 +3,6 @@ license: apache-2.0
 base_model: mse30/bart-base-finetuned-pubmed
 tags:
 - generated_from_trainer
-metrics:
-- accuracy
 model-index:
 - name: unipelt
   results: []
@@ -16,9 +14,6 @@ should probably proofread and complete it, then remove this comment. -->
 # unipelt
 This model is a fine-tuned version of [mse30/bart-base-finetuned-pubmed](https://huggingface.co/mse30/bart-base-finetuned-pubmed) on an unknown dataset.
-It achieves the following results on the evaluation set:
-- Loss: 7.2003
-- Accuracy: 0.0659
 ## Model description

 base_model: mse30/bart-base-finetuned-pubmed
 tags:
 - generated_from_trainer
 model-index:
 - name: unipelt
   results: []
 # unipelt
 This model is a fine-tuned version of [mse30/bart-base-finetuned-pubmed](https://huggingface.co/mse30/bart-base-finetuned-pubmed) on an unknown dataset.
 ## Model description

config.json CHANGED Viewed

@@ -4,13 +4,10 @@
   "activation_function": "gelu",
   "adapters": {
     "adapters": {
-      "adapter1": "847a59cd9f1cbf0e",
-      "adapter2": "847a59cd9f1cbf0e",
-      "adapter3": "847a59cd9f1cbf0e",
-      "unipelt": "65e04f01fd344156"
     },
     "config_map": {
-      "65e04f01fd344156": {
         "architecture": "union",
         "configs": [
           {
@@ -42,46 +39,44 @@
             "prefix_length": 10,
             "shared_gating": true,
             "use_gating": true
           }
         ]
-      },
-      "847a59cd9f1cbf0e": {
-        "adapter_residual_before_ln": false,
-        "cross_adapter": false,
-        "factorized_phm_W": true,
-        "factorized_phm_rule": false,
-        "hypercomplex_nonlinearity": "glorot-uniform",
-        "init_weights": "bert",
-        "inv_adapter": null,
-        "inv_adapter_reduction_factor": null,
-        "is_parallel": false,
-        "learn_phm": true,
-        "leave_out": [],
-        "ln_after": false,
-        "ln_before": false,
-        "mh_adapter": false,
-        "non_linearity": "relu",
-        "original_ln_after": true,
-        "original_ln_before": true,
-        "output_adapter": true,
-        "phm_bias": true,
-        "phm_c_init": "normal",
-        "phm_dim": 4,
-        "phm_init_range": 0.0001,
-        "phm_layer": false,
-        "phm_rank": 1,
-        "reduction_factor": 16,
-        "residual_before_ln": true,
-        "scaling": 1.0,
-        "shared_W_phm": false,
-        "shared_phm_rule": true,
-        "use_gating": true
       }
     },
     "fusion_config_map": {},
-    "fusions": {
-      "adapter1,adapter2,adapter3": "dynamic"
-    }
   },
   "add_bias_logits": false,
   "add_final_layer_norm": false,

   "activation_function": "gelu",
   "adapters": {
     "adapters": {
+      "unipelt": "0815dd75d5ff5808"
     },
     "config_map": {
+      "0815dd75d5ff5808": {
         "architecture": "union",
         "configs": [
           {
             "prefix_length": 10,
             "shared_gating": true,
             "use_gating": true
+          },
+          {
+            "adapter_residual_before_ln": false,
+            "cross_adapter": false,
+            "factorized_phm_W": true,
+            "factorized_phm_rule": false,
+            "hypercomplex_nonlinearity": "glorot-uniform",
+            "init_weights": "bert",
+            "inv_adapter": null,
+            "inv_adapter_reduction_factor": null,
+            "is_parallel": false,
+            "learn_phm": true,
+            "leave_out": [],
+            "ln_after": false,
+            "ln_before": false,
+            "mh_adapter": false,
+            "non_linearity": "relu",
+            "original_ln_after": true,
+            "original_ln_before": true,
+            "output_adapter": true,
+            "phm_bias": true,
+            "phm_c_init": "normal",
+            "phm_dim": 4,
+            "phm_init_range": 0.0001,
+            "phm_layer": false,
+            "phm_rank": 1,
+            "reduction_factor": 16,
+            "residual_before_ln": true,
+            "scaling": 1.0,
+            "shared_W_phm": false,
+            "shared_phm_rule": true,
+            "use_gating": true
           }
         ]
       }
     },
     "fusion_config_map": {},
+    "fusions": {}
   },
   "add_bias_logits": false,
   "add_final_layer_norm": false,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:324c15fb73d458634fe03bbf68731a4ebf5bdeaa42aa59a875530474fda0671d
-size 717320364

 version https://git-lfs.github.com/spec/v1
+oid sha256:9929a3f9944a7877ee27cbf23be5300c743831eb9da6bf3f76f766d986216192
+size 625051084

runs/Mar16_04-14-07_13e96b604141/events.out.tfevents.1710562451.13e96b604141.322.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5bad1c2d9fcfb20ffc75442666af32ee62b29876cdc6d8040d5bfb98d19af46
+size 5807

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14d958d016d80c8ad6d5cfb006cedab7b719f206cbb14d9b92ac2f6a755c4507
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:323920350a32a56049c4982458db48b80028ef6c3e17431e268a26cdb321f260
 size 4792