Training in progress epoch 0

Browse files

Files changed (7) hide show

config.json +130 -130
merges.txt +0 -0
model.safetensors +1 -1
special_tokens_map.json +25 -11
tokenizer.json +0 -0
tokenizer_config.json +26 -25
vocab.json +0 -0

config.json CHANGED Viewed

@@ -12,142 +12,142 @@
   "hidden_dropout_prob": 0.0,
   "hidden_size": 1024,
   "id2label": {
-    "0": "Z",
-    "1": "vsp",
-    "2": "vms",
-    "3": "vsg",
-    "4": "vss",
-    "5": "Fc",
-    "6": "vmn",
-    "7": "Fpt",
-    "8": "rn",
-    "9": "dp",
-    "10": "vas",
-    "11": "sp",
-    "12": "vsm",
     "13": "vam",
-    "14": "Fs",
-    "15": "vai",
-    "16": "vag",
-    "17": "np",
-    "18": "Fd",
-    "19": "pi",
-    "20": "Fp",
-    "21": "pr",
-    "22": "Zm",
-    "23": "vap",
-    "24": "dt",
-    "25": "I",
-    "26": "ao",
-    "27": "Fh",
-    "28": "i",
-    "29": "de",
-    "30": "dn",
-    "31": "pe",
-    "32": "van",
-    "33": "aq",
-    "34": "nc",
-    "35": "dd",
-    "36": "da",
-    "37": "vmm",
-    "38": "vsn",
-    "39": "px",
-    "40": "vmi",
-    "41": "cc",
-    "42": "Fat",
-    "43": "pd",
-    "44": "pn",
-    "45": "Fe",
-    "46": "vmp",
-    "47": "Fz",
-    "48": "pp",
-    "49": "Faa",
-    "50": "Fpa",
-    "51": "W",
-    "52": "Fit",
-    "53": "Fx",
-    "54": "cs",
-    "55": "di",
-    "56": "Fg",
-    "57": "vmg",
-    "58": "Y",
-    "59": "rg",
-    "60": "p0",
-    "61": "Zp",
-    "62": "X",
-    "63": "Fia",
-    "64": "vsi",
-    "65": "pt"
   },
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "label2id": {
-    "Faa": 49,
-    "Fat": 42,
-    "Fc": 5,
-    "Fd": 18,
-    "Fe": 45,
-    "Fg": 56,
-    "Fh": 27,
-    "Fia": 63,
-    "Fit": 52,
-    "Fp": 20,
-    "Fpa": 50,
-    "Fpt": 7,
-    "Fs": 14,
-    "Fx": 53,
-    "Fz": 47,
-    "I": 25,
-    "W": 51,
-    "X": 62,
-    "Y": 58,
-    "Z": 0,
-    "Zm": 22,
-    "Zp": 61,
-    "ao": 26,
-    "aq": 33,
-    "cc": 41,
-    "cs": 54,
-    "da": 36,
-    "dd": 35,
-    "de": 29,
-    "di": 55,
-    "dn": 30,
-    "dp": 9,
-    "dt": 24,
-    "i": 28,
-    "nc": 34,
-    "np": 17,
-    "p0": 60,
-    "pd": 43,
-    "pe": 31,
-    "pi": 19,
-    "pn": 44,
-    "pp": 48,
-    "pr": 21,
-    "pt": 65,
-    "px": 39,
-    "rg": 59,
-    "rn": 8,
-    "sp": 11,
-    "vag": 16,
-    "vai": 15,
     "vam": 13,
-    "van": 32,
-    "vap": 23,
-    "vas": 10,
-    "vmg": 57,
-    "vmi": 40,
-    "vmm": 37,
-    "vmn": 6,
-    "vmp": 46,
-    "vms": 2,
-    "vsg": 3,
-    "vsi": 64,
-    "vsm": 12,
-    "vsn": 38,
-    "vsp": 1,
-    "vss": 4
   },
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,

   "hidden_dropout_prob": 0.0,
   "hidden_size": 1024,
   "id2label": {
+    "0": "X",
+    "1": "vai",
+    "2": "vap",
+    "3": "Zm",
+    "4": "vas",
+    "5": "Fat",
+    "6": "Fp",
+    "7": "ao",
+    "8": "W",
+    "9": "Fg",
+    "10": "sp",
+    "11": "vsg",
+    "12": "dt",
     "13": "vam",
+    "14": "pi",
+    "15": "dp",
+    "16": "vmm",
+    "17": "pn",
+    "18": "vmg",
+    "19": "Fpt",
+    "20": "rg",
+    "21": "Fs",
+    "22": "i",
+    "23": "Zp",
+    "24": "aq",
+    "25": "Fd",
+    "26": "vms",
+    "27": "vmp",
+    "28": "Fz",
+    "29": "dn",
+    "30": "vag",
+    "31": "vsn",
+    "32": "nc",
+    "33": "vss",
+    "34": "vsm",
+    "35": "Fh",
+    "36": "I",
+    "37": "de",
+    "38": "px",
+    "39": "Fc",
+    "40": "Faa",
+    "41": "pe",
+    "42": "Z",
+    "43": "vmi",
+    "44": "pp",
+    "45": "da",
+    "46": "cs",
+    "47": "rn",
+    "48": "vsi",
+    "49": "Fit",
+    "50": "Fe",
+    "51": "p0",
+    "52": "Fx",
+    "53": "Y",
+    "54": "cc",
+    "55": "van",
+    "56": "Fpa",
+    "57": "pr",
+    "58": "dd",
+    "59": "pt",
+    "60": "vmn",
+    "61": "di",
+    "62": "np",
+    "63": "vsp",
+    "64": "Fia",
+    "65": "pd"
   },
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "label2id": {
+    "Faa": 40,
+    "Fat": 5,
+    "Fc": 39,
+    "Fd": 25,
+    "Fe": 50,
+    "Fg": 9,
+    "Fh": 35,
+    "Fia": 64,
+    "Fit": 49,
+    "Fp": 6,
+    "Fpa": 56,
+    "Fpt": 19,
+    "Fs": 21,
+    "Fx": 52,
+    "Fz": 28,
+    "I": 36,
+    "W": 8,
+    "X": 0,
+    "Y": 53,
+    "Z": 42,
+    "Zm": 3,
+    "Zp": 23,
+    "ao": 7,
+    "aq": 24,
+    "cc": 54,
+    "cs": 46,
+    "da": 45,
+    "dd": 58,
+    "de": 37,
+    "di": 61,
+    "dn": 29,
+    "dp": 15,
+    "dt": 12,
+    "i": 22,
+    "nc": 32,
+    "np": 62,
+    "p0": 51,
+    "pd": 65,
+    "pe": 41,
+    "pi": 14,
+    "pn": 17,
+    "pp": 44,
+    "pr": 57,
+    "pt": 59,
+    "px": 38,
+    "rg": 20,
+    "rn": 47,
+    "sp": 10,
+    "vag": 30,
+    "vai": 1,
     "vam": 13,
+    "van": 55,
+    "vap": 2,
+    "vas": 4,
+    "vmg": 18,
+    "vmi": 43,
+    "vmm": 16,
+    "vmn": 60,
+    "vmp": 27,
+    "vms": 26,
+    "vsg": 11,
+    "vsi": 48,
+    "vsm": 34,
+    "vsn": 31,
+    "vsp": 63,
+    "vss": 33
   },
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8016e124680e5d17f08af502ad581978dc381a70defa07fc36dd4577df19455a
 size 1417546912

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc4b917fde90db6334cb3c9da523e6c0ebd33e7b8744a79c1de5d5c5cac953e2
 size 1417546912

special_tokens_map.json CHANGED Viewed

@@ -1,36 +1,50 @@
 {
   "cls_token": {
-    "content": "[CLS]",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
-  "mask_token": {
-    "content": "[MASK]",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "pad_token": {
-    "content": "[PAD]",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "sep_token": {
-    "content": "[SEP]",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
-    "content": "[UNK]",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   }

 {
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
   "cls_token": {
+    "content": "<s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
+  "eos_token": {
+    "content": "</s>",
     "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "pad_token": {
+    "content": "<pad>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "sep_token": {
+    "content": "</s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
+    "content": "<unk>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   }

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1,57 +1,58 @@
 {
   "added_tokens_decoder": {
     "0": {
-      "content": "[MASK]",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
     "1": {
-      "content": "[PAD]",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "3": {
-      "content": "[UNK]",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "4": {
-      "content": "[CLS]",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "5": {
-      "content": "[SEP]",
-      "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     }
   },
   "clean_up_tokenization_spaces": true,
-  "cls_token": "[CLS]",
-  "do_basic_tokenize": true,
-  "do_lower_case": false,
-  "mask_token": "[MASK]",
   "model_max_length": 512,
-  "never_split": null,
-  "pad_token": "[PAD]",
-  "sep_token": "[SEP]",
-  "strip_accents": false,
-  "tokenize_chinese_chars": true,
-  "tokenizer_class": "BertTokenizer",
-  "unk_token": "[UNK]"
 }

 {
+  "add_prefix_space": true,
   "added_tokens_decoder": {
     "0": {
+      "content": "<s>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
     "1": {
+      "content": "<pad>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "2": {
+      "content": "</s>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "3": {
+      "content": "<unk>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "4": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     }
   },
+  "bos_token": "<s>",
   "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "max_len": 512,
   "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
 }

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff