THUDM
/

chatglm2-6b

@@ -70,6 +70,9 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
         self.vocab_file = vocab_file
         self.tokenizer = SPTokenizer(vocab_file)
         super().__init__(padding_side=padding_side, clean_up_tokenization_spaces=clean_up_tokenization_spaces, **kwargs)
         self.special_tokens = {
             "<bos>": self.tokenizer.bos_id,

         self.vocab_file = vocab_file
         self.tokenizer = SPTokenizer(vocab_file)
+        kwargs.pop("eos_token")
+        kwargs.pop("pad_token")
+        kwargs.pop("unk_token")
         super().__init__(padding_side=padding_side, clean_up_tokenization_spaces=clean_up_tokenization_spaces, **kwargs)
         self.special_tokens = {
             "<bos>": self.tokenizer.bos_id,