Upload tokenizer

Files changed (4) hide show

added_tokens.json ADDED Viewed

+{
+  "[UNK]": 84
+}

special_tokens_map.json ADDED Viewed

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer_config.json ADDED Viewed

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "81": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "82": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "83": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "84": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

vocab.txt ADDED Viewed

+[PAD]
+BicH
+CrtA
+PotH
+SodD
+UreG
+HgbI
+PltA
+WbcB
+BicE
+PotJ
+SodA
+UreH
+PltC
+WbcD
+BicF
+CrtB
+UreI
+WbcE
+BicD
+HgbH
+PltB
+WbcC
+CrtC
+PotE
+SodB
+UreC
+HgbJ
+PltH
+WbcF
+BicC
+PotF
+UreB
+SodC
+SodG
+BicB
+CrtD
+PotB
+SodI
+PltG
+SodJ
+PltF
+WbcG
+PotG
+PltE
+BicG
+PotC
+SodE
+PltD
+BicA
+CrtG
+WbcH
+PotD
+WbcA
+BicI
+UreA
+WbcI
+HgbG
+PltJ
+WbcJ
+PltI
+BicJ
+HgbF
+HgbD
+HgbE
+HgbC
+PotA
+HgbA
+HgbB
+SodF
+SodH
+CrtI
+UreJ
+CrtJ
+CrtH
+PotI
+UreF
+UreE
+UreD
+CrtE
+CrtF
+[CLS]
+[SEP]
+[MASK]