Model save

Browse files

Files changed (5) hide show

README.md +0 -5
config.json +38 -1
model.safetensors +2 -2
runs/Mar16_04-20-55_13e96b604141/events.out.tfevents.1710562860.13e96b604141.387.0 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,8 +3,6 @@ license: apache-2.0
 base_model: mse30/bart-base-finetuned-pubmed
 tags:
 - generated_from_trainer
-metrics:
-- accuracy
 model-index:
 - name: unipelt
   results: []
@@ -16,9 +14,6 @@ should probably proofread and complete it, then remove this comment. -->
 # unipelt
 This model is a fine-tuned version of [mse30/bart-base-finetuned-pubmed](https://huggingface.co/mse30/bart-base-finetuned-pubmed) on an unknown dataset.
-It achieves the following results on the evaluation set:
-- Loss: 9.5453
-- Accuracy: 0.0169
 ## Model description

 base_model: mse30/bart-base-finetuned-pubmed
 tags:
 - generated_from_trainer
 model-index:
 - name: unipelt
   results: []
 # unipelt
 This model is a fine-tuned version of [mse30/bart-base-finetuned-pubmed](https://huggingface.co/mse30/bart-base-finetuned-pubmed) on an unknown dataset.
 ## Model description

config.json CHANGED Viewed

@@ -4,6 +4,9 @@
   "activation_function": "gelu",
   "adapters": {
     "adapters": {
       "unipelt": "0815dd75d5ff5808"
     },
     "config_map": {
@@ -73,10 +76,44 @@
             "use_gating": true
           }
         ]
       }
     },
     "fusion_config_map": {},
-    "fusions": {}
   },
   "add_bias_logits": false,
   "add_final_layer_norm": false,

   "activation_function": "gelu",
   "adapters": {
     "adapters": {
+      "adapter1": "847a59cd9f1cbf0e",
+      "adapter2": "847a59cd9f1cbf0e",
+      "adapter3": "847a59cd9f1cbf0e",
       "unipelt": "0815dd75d5ff5808"
     },
     "config_map": {
             "use_gating": true
           }
         ]
+      },
+      "847a59cd9f1cbf0e": {
+        "adapter_residual_before_ln": false,
+        "cross_adapter": false,
+        "factorized_phm_W": true,
+        "factorized_phm_rule": false,
+        "hypercomplex_nonlinearity": "glorot-uniform",
+        "init_weights": "bert",
+        "inv_adapter": null,
+        "inv_adapter_reduction_factor": null,
+        "is_parallel": false,
+        "learn_phm": true,
+        "leave_out": [],
+        "ln_after": false,
+        "ln_before": false,
+        "mh_adapter": false,
+        "non_linearity": "relu",
+        "original_ln_after": true,
+        "original_ln_before": true,
+        "output_adapter": true,
+        "phm_bias": true,
+        "phm_c_init": "normal",
+        "phm_dim": 4,
+        "phm_init_range": 0.0001,
+        "phm_layer": false,
+        "phm_rank": 1,
+        "reduction_factor": 16,
+        "residual_before_ln": true,
+        "scaling": 1.0,
+        "shared_W_phm": false,
+        "shared_phm_rule": true,
+        "use_gating": true
       }
     },
     "fusion_config_map": {},
+    "fusions": {
+      "adapter1,adapter2,adapter3": "dynamic"
+    }
   },
   "add_bias_logits": false,
   "add_final_layer_norm": false,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9929a3f9944a7877ee27cbf23be5300c743831eb9da6bf3f76f766d986216192
-size 625051084

 version https://git-lfs.github.com/spec/v1
+oid sha256:428d82d0e717392b4332faa292284179e62945c99343ff104a1ce0c537c2a56c
+size 720945604

runs/Mar16_04-20-55_13e96b604141/events.out.tfevents.1710562860.13e96b604141.387.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2432e785623752a934c7c7e7b7452d29b85f2e3ef1f001ea59164064b3c0f35f
+size 5807

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:323920350a32a56049c4982458db48b80028ef6c3e17431e268a26cdb321f260
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:5db3bd67f7ccb239064a38709e5c31c5d4433e4bc69c75ed56d21a45c9ec1cd7
 size 4792