radlab
/

polish-qa-v2

Question Answering

Inference Endpoints

Model card Files Files and versions Community

pkedzia commited on Jul 15, 2024

Commit

db69427

·

verified ·

1 Parent(s): 105ef38

Upload tokenizer.json

Updated tokenizer.json

Files changed (1) hide show

tokenizer.json +12 -11

tokenizer.json CHANGED Viewed

@@ -5,48 +5,48 @@
   "added_tokens": [
     {
       "id": 0,
       "content": "<s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false,
-      "special": true
     },
     {
       "id": 1,
       "content": "<pad>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false,
-      "special": true
     },
     {
       "id": 2,
       "content": "</s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false,
-      "special": true
     },
     {
       "id": 3,
       "content": "<unk>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false,
-      "special": true
     },
     {
       "id": 128000,
       "content": "<mask>",
       "single_word": false,
       "lstrip": true,
       "rstrip": false,
-      "normalized": false,
-      "special": true
     }
   ],
   "normalizer": {
@@ -55,7 +55,8 @@
   "pre_tokenizer": {
     "type": "Metaspace",
     "replacement": "▁",
-    "add_prefix_space": false
   },
   "post_processor": {
     "type": "RobertaProcessing",

   "added_tokens": [
     {
       "id": 0,
+      "special": true,
       "content": "<s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false
     },
     {
       "id": 1,
+      "special": true,
       "content": "<pad>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false
     },
     {
       "id": 2,
+      "special": true,
       "content": "</s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false
     },
     {
       "id": 3,
+      "special": true,
       "content": "<unk>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false
     },
     {
       "id": 128000,
+      "special": true,
       "content": "<mask>",
       "single_word": false,
       "lstrip": true,
       "rstrip": false,
+      "normalized": false
     }
   ],
   "normalizer": {
   "pre_tokenizer": {
     "type": "Metaspace",
     "replacement": "▁",
+    "add_prefix_space": true,
+	"prepend_scheme": "never"
   },
   "post_processor": {
     "type": "RobertaProcessing",