Upload tokenizer

Files changed (3) hide show

README.md CHANGED Viewed

@@ -1,13 +1,13 @@
 ---
-license: apache-2.0
 library_name: peft
 tags:
 - trl
 - sft
 - generated_from_trainer
-base_model: Qwen/Qwen2-0.5B-Instruct
-datasets:
-- generator
 model-index:
 - name: qwen2
   results: []

 ---
+base_model: Qwen/Qwen2-0.5B-Instruct
+datasets:
+- generator
 library_name: peft
+license: apache-2.0
 tags:
 - trl
 - sft
 - generated_from_trainer
 model-index:
 - name: qwen2
   results: []

special_tokens_map.json CHANGED Viewed

@@ -10,5 +10,11 @@
     "rstrip": false,
     "single_word": false
   },
-  "pad_token": "<|im_end|>"
 }

     "rstrip": false,
     "single_word": false
   },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
 }

tokenizer_config.json CHANGED Viewed

@@ -35,8 +35,8 @@
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|im_end|>",
   "errors": "replace",
-  "model_max_length": 2048,
-  "pad_token": "<|im_end|>",
   "split_special_tokens": false,
   "tokenizer_class": "Qwen2Tokenizer",
   "unk_token": null

   "clean_up_tokenization_spaces": false,
   "eos_token": "<|im_end|>",
   "errors": "replace",
+  "model_max_length": 32768,
+  "pad_token": "<|endoftext|>",
   "split_special_tokens": false,
   "tokenizer_class": "Qwen2Tokenizer",
   "unk_token": null