Spaces:

nicpopovic
/

ember_details

Sleeping

App Files Files Community

nicpopovic commited on Oct 11, 2024

Commit

a65e909

verified ·

1 Parent(s): f19c5a7

Upload 11 files

Browse files

Files changed (11) hide show

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA/checkpoint.pt +3 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA/config.json +29 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA/config_train.json +51 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/dR8xQB4ODU/checkpoint.pt +3 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/dR8xQB4ODU/config.json +166 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/dR8xQB4ODU/config_train.json +51 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/pbK46jjAVx/checkpoint.pt +3 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/pbK46jjAVx/config.json +166 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/pbK46jjAVx/config_train.json +51 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/config.json +8 -0
data/meta-llama/Llama-3.2-1B/STOKE_100/stoke_config.json +10 -0

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA/checkpoint.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25951d9b73437a7aa344f4c207cbda2f88d9bf5fa94d1a779617948b18a1c4ed
+size 8439912

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA/config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+ "model": "meta-llama/Llama-3.2-1B",
+ "type": "span_classifier",
+ "label_map": [
+  "no_span",
+  "span"
+ ],
+ "learning_rate": 0.0003,
+ "classifier_dim": 4096,
+ "loss_weights": [
+  1.0,
+  1.0
+ ],
+ "identifier": "Rxi8b70XJA",
+ "best_f1_validation": 0.8677362203598022,
+ "best_f1_validation_classwise": {
+  "span": {
+   "p": 0.896858811378479,
+   "r": 0.8404456377029419,
+   "f": 0.867736279964447,
+   "s": 24324.0
+  },
+  "macro": {
+   "p": 0.896858811378479,
+   "r": 0.8404456377029419,
+   "f": 0.867736279964447
+  }
+ }
+}

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA/config_train.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+ "path": "data/meta-llama/Llama-3.2-1B/STOKE_100",
+ "splits": [
+  "train",
+  "validation"
+ ],
+ "layers": [
+  8,
+  9,
+  10,
+  11,
+  12
+ ],
+ "hfcache": "",
+ "classifier_dims": [
+  4096
+ ],
+ "learning_rates": [
+  0.0001,
+  5e-05,
+  0.0003
+ ],
+ "cuda": true,
+ "n_steps_per_epoch": 10000,
+ "n_epochs": 30,
+ "batch_size": 8,
+ "balance_loss": false,
+ "loss_weights_span": [
+  [
+   1.0,
+   1.0
+  ],
+  [
+   1.0,
+   50.0
+  ],
+  [
+   1.0,
+   100.0
+  ]
+ ],
+ "time": 1727765390.5829365,
+ "config_dataset": {
+  "generation_kwargs": {
+   "max_new_tokens": 100,
+   "repetition_penalty": 1.2
+  },
+  "model_id": "meta-llama/Llama-3.2-1B",
+  "flair_model_name": "flair/ner-english-ontonotes-large"
+ }
+}

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/dR8xQB4ODU/checkpoint.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dce5b3038d8767430a8bba16af61ec6af67c9d1aedc75a9f34c01feebac09b6e
+size 33884328

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/dR8xQB4ODU/config.json ADDED Viewed

	@@ -0,0 +1,166 @@

+{
+ "layer": 10,
+ "model": "meta-llama/Llama-3.2-1B",
+ "type": "token_classifier",
+ "label_map": [
+  "O",
+  "CARDINAL",
+  "DATE",
+  "EVENT",
+  "FAC",
+  "GPE",
+  "LANGUAGE",
+  "LAW",
+  "LOC",
+  "MONEY",
+  "NORP",
+  "ORDINAL",
+  "ORG",
+  "PERCENT",
+  "PERSON",
+  "PRODUCT",
+  "QUANTITY",
+  "TIME",
+  "WORK_OF_ART"
+ ],
+ "learning_rate": 5e-05,
+ "classifier_dim": 4096,
+ "loss_weights": [
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0
+ ],
+ "identifier": "dR8xQB4ODU",
+ "best_f1_validation": 0.9056437015533447,
+ "best_f1_validation_classwise": {
+  "CARDINAL": {
+   "p": 0.8679801225662231,
+   "r": 0.8777581453323364,
+   "f": 0.8728417754173279,
+   "s": 10741.0
+  },
+  "DATE": {
+   "p": 0.9519810676574707,
+   "r": 0.9389873743057251,
+   "f": 0.9454395771026611,
+   "s": 8572.0
+  },
+  "EVENT": {
+   "p": 0.8587140440940857,
+   "r": 0.8319672346115112,
+   "f": 0.8451290726661682,
+   "s": 1220.0
+  },
+  "FAC": {
+   "p": 0.8515185713768005,
+   "r": 0.8122317790985107,
+   "f": 0.8314113020896912,
+   "s": 932.0
+  },
+  "GPE": {
+   "p": 0.9000998735427856,
+   "r": 0.9094448685646057,
+   "f": 0.904748260974884,
+   "s": 6935.0
+  },
+  "LANGUAGE": {
+   "p": 0.75,
+   "r": 0.7200000286102295,
+   "f": 0.7346938848495483,
+   "s": 25.0
+  },
+  "LAW": {
+   "p": 0.8709677457809448,
+   "r": 0.73828125,
+   "f": 0.7991543412208557,
+   "s": 256.0
+  },
+  "LOC": {
+   "p": 0.8258426785469055,
+   "r": 0.7101449370384216,
+   "f": 0.7636363506317139,
+   "s": 414.0
+  },
+  "MONEY": {
+   "p": 0.876042902469635,
+   "r": 0.8626760840415955,
+   "f": 0.8693081140518188,
+   "s": 1704.0
+  },
+  "NORP": {
+   "p": 0.9160357713699341,
+   "r": 0.887333333492279,
+   "f": 0.9014561772346497,
+   "s": 1500.0
+  },
+  "ORDINAL": {
+   "p": 0.9303238391876221,
+   "r": 0.9498997926712036,
+   "f": 0.9400099515914917,
+   "s": 998.0
+  },
+  "ORG": {
+   "p": 0.8974575400352478,
+   "r": 0.8792765140533447,
+   "f": 0.8882739543914795,
+   "s": 9675.0
+  },
+  "PERCENT": {
+   "p": 0.8629592657089233,
+   "r": 0.8083720803260803,
+   "f": 0.8347742557525635,
+   "s": 1075.0
+  },
+  "PERSON": {
+   "p": 0.9707135558128357,
+   "r": 0.9713156223297119,
+   "f": 0.9710144996643066,
+   "s": 12899.0
+  },
+  "PRODUCT": {
+   "p": 0.7828418016433716,
+   "r": 0.7564767003059387,
+   "f": 0.7694334387779236,
+   "s": 386.0
+  },
+  "QUANTITY": {
+   "p": 0.8409090638160706,
+   "r": 0.7758846879005432,
+   "f": 0.8070893287658691,
+   "s": 763.0
+  },
+  "TIME": {
+   "p": 0.8710959553718567,
+   "r": 0.8373362421989441,
+   "f": 0.8538825511932373,
+   "s": 1832.0
+  },
+  "WORK_OF_ART": {
+   "p": 0.7803030014038086,
+   "r": 0.7152777910232544,
+   "f": 0.7463768124580383,
+   "s": 576.0
+  },
+  "macro": {
+   "p": 0.8669881820678711,
+   "r": 0.8323702216148376,
+   "f": 0.8488152027130127
+  }
+ }
+}

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/dR8xQB4ODU/config_train.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+ "path": "data/meta-llama/Llama-3.2-1B/STOKE_100",
+ "splits": [
+  "train",
+  "validation"
+ ],
+ "layers": [
+  8,
+  9,
+  10,
+  11,
+  12
+ ],
+ "hfcache": "",
+ "classifier_dims": [
+  4096
+ ],
+ "learning_rates": [
+  0.0001,
+  5e-05,
+  0.0003
+ ],
+ "cuda": true,
+ "n_steps_per_epoch": 10000,
+ "n_epochs": 30,
+ "batch_size": 8,
+ "balance_loss": false,
+ "loss_weights_span": [
+  [
+   1.0,
+   1.0
+  ],
+  [
+   1.0,
+   50.0
+  ],
+  [
+   1.0,
+   100.0
+  ]
+ ],
+ "time": 1727765390.5829365,
+ "config_dataset": {
+  "generation_kwargs": {
+   "max_new_tokens": 100,
+   "repetition_penalty": 1.2
+  },
+  "model_id": "meta-llama/Llama-3.2-1B",
+  "flair_model_name": "flair/ner-english-ontonotes-large"
+ }
+}

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/pbK46jjAVx/checkpoint.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f32816959f5fd27967c754a61b07d8ae6c92b7881e2fbb6a68b54b8c0c575122
+size 33884328

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/pbK46jjAVx/config.json ADDED Viewed

	@@ -0,0 +1,166 @@

+{
+ "layer": 10,
+ "model": "meta-llama/Llama-3.2-1B",
+ "type": "token_classifier",
+ "label_map": [
+  "O",
+  "CARDINAL",
+  "DATE",
+  "EVENT",
+  "FAC",
+  "GPE",
+  "LANGUAGE",
+  "LAW",
+  "LOC",
+  "MONEY",
+  "NORP",
+  "ORDINAL",
+  "ORG",
+  "PERCENT",
+  "PERSON",
+  "PRODUCT",
+  "QUANTITY",
+  "TIME",
+  "WORK_OF_ART"
+ ],
+ "learning_rate": 0.0003,
+ "classifier_dim": 4096,
+ "loss_weights": [
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0,
+  1.0
+ ],
+ "identifier": "pbK46jjAVx",
+ "best_f1_validation": 0.9048610329627991,
+ "best_f1_validation_classwise": {
+  "CARDINAL": {
+   "p": 0.8730558156967163,
+   "r": 0.8727306723594666,
+   "f": 0.872893214225769,
+   "s": 10741.0
+  },
+  "DATE": {
+   "p": 0.9534441828727722,
+   "r": 0.9365375638008118,
+   "f": 0.944915235042572,
+   "s": 8572.0
+  },
+  "EVENT": {
+   "p": 0.8540268540382385,
+   "r": 0.83442622423172,
+   "f": 0.844112753868103,
+   "s": 1220.0
+  },
+  "FAC": {
+   "p": 0.8227027058601379,
+   "r": 0.8165236115455627,
+   "f": 0.8196015357971191,
+   "s": 932.0
+  },
+  "GPE": {
+   "p": 0.9014912247657776,
+   "r": 0.9065608978271484,
+   "f": 0.9040189981460571,
+   "s": 6935.0
+  },
+  "LANGUAGE": {
+   "p": 0.7272727489471436,
+   "r": 0.6399999856948853,
+   "f": 0.6808510422706604,
+   "s": 25.0
+  },
+  "LAW": {
+   "p": 0.8500000238418579,
+   "r": 0.73046875,
+   "f": 0.7857142686843872,
+   "s": 256.0
+  },
+  "LOC": {
+   "p": 0.8867924809455872,
+   "r": 0.6811594367027283,
+   "f": 0.7704918384552002,
+   "s": 414.0
+  },
+  "MONEY": {
+   "p": 0.873665452003479,
+   "r": 0.8644366264343262,
+   "f": 0.8690265417098999,
+   "s": 1704.0
+  },
+  "NORP": {
+   "p": 0.9220505356788635,
+   "r": 0.875333309173584,
+   "f": 0.898084819316864,
+   "s": 1500.0
+  },
+  "ORDINAL": {
+   "p": 0.9244186282157898,
+   "r": 0.9559118151664734,
+   "f": 0.9399014711380005,
+   "s": 998.0
+  },
+  "ORG": {
+   "p": 0.8920637965202332,
+   "r": 0.8841343522071838,
+   "f": 0.888081431388855,
+   "s": 9675.0
+  },
+  "PERCENT": {
+   "p": 0.8530852198600769,
+   "r": 0.8102325797080994,
+   "f": 0.8311069011688232,
+   "s": 1075.0
+  },
+  "PERSON": {
+   "p": 0.9692212343215942,
+   "r": 0.9716256856918335,
+   "f": 0.9704219698905945,
+   "s": 12899.0
+  },
+  "PRODUCT": {
+   "p": 0.7886179089546204,
+   "r": 0.7538859844207764,
+   "f": 0.7708609104156494,
+   "s": 386.0
+  },
+  "QUANTITY": {
+   "p": 0.8215258717536926,
+   "r": 0.7903014421463013,
+   "f": 0.8056111931800842,
+   "s": 763.0
+  },
+  "TIME": {
+   "p": 0.8752886652946472,
+   "r": 0.8275108933448792,
+   "f": 0.8507295250892639,
+   "s": 1832.0
+  },
+  "WORK_OF_ART": {
+   "p": 0.7937743067741394,
+   "r": 0.7083333134651184,
+   "f": 0.7486238479614258,
+   "s": 576.0
+  },
+  "macro": {
+   "p": 0.8656943440437317,
+   "r": 0.8255618214607239,
+   "f": 0.8441693186759949
+  }
+ }
+}

data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/pbK46jjAVx/config_train.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+ "path": "data/meta-llama/Llama-3.2-1B/STOKE_100",
+ "splits": [
+  "train",
+  "validation"
+ ],
+ "layers": [
+  8,
+  9,
+  10,
+  11,
+  12
+ ],
+ "hfcache": "",
+ "classifier_dims": [
+  4096
+ ],
+ "learning_rates": [
+  0.0001,
+  5e-05,
+  0.0003
+ ],
+ "cuda": true,
+ "n_steps_per_epoch": 10000,
+ "n_epochs": 30,
+ "batch_size": 8,
+ "balance_loss": false,
+ "loss_weights_span": [
+  [
+   1.0,
+   1.0
+  ],
+  [
+   1.0,
+   50.0
+  ],
+  [
+   1.0,
+   100.0
+  ]
+ ],
+ "time": 1727765390.5829365,
+ "config_dataset": {
+  "generation_kwargs": {
+   "max_new_tokens": 100,
+   "repetition_penalty": 1.2
+  },
+  "model_id": "meta-llama/Llama-3.2-1B",
+  "flair_model_name": "flair/ner-english-ontonotes-large"
+ }
+}

data/meta-llama/Llama-3.2-1B/STOKE_100/config.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+ "generation_kwargs": {
+  "max_new_tokens": 100,
+  "repetition_penalty": 1.2
+ },
+ "model_id": "meta-llama/Llama-3.2-1B",
+ "flair_model_name": "flair/ner-english-ontonotes-large"
+}

data/meta-llama/Llama-3.2-1B/STOKE_100/stoke_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "default": {
+        "classifier_token": "data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/pbK46jjAVx",
+        "classifier_span": "data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA"
+    },
+    "basic": {
+        "classifier_token": "data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/token_classifier/dR8xQB4ODU",
+        "classifier_span": "data/meta-llama/Llama-3.2-1B/STOKE_100/checkpoints/span_classifier/Rxi8b70XJA"
+    }
+}