stockmark
/

bart-base-japanese-news

@@ -142,6 +142,14 @@ class BartJapaneseNewsTokenizer(BartTokenizer):
         self.sp_model_kwargs = {} if sp_model_kwargs is None else sp_model_kwargs
         super(BartTokenizer, self).__init__(
             do_lower_case=do_lower_case,
             remove_space=remove_space,
@@ -157,14 +165,6 @@ class BartJapaneseNewsTokenizer(BartTokenizer):
             **kwargs,
         )
-        self.do_lower_case = do_lower_case
-        self.remove_space = remove_space
-        self.clean_text = clean_text
-        self.vocab_file = vocab_file
-        self.sp_model = spm.SentencePieceProcessor(**self.sp_model_kwargs)
-        self.sp_model.Load(vocab_file)
     @property
     def vocab_size(self):
         return len(self.sp_model)

         self.sp_model_kwargs = {} if sp_model_kwargs is None else sp_model_kwargs
+        self.do_lower_case = do_lower_case
+        self.remove_space = remove_space
+        self.clean_text = clean_text
+        self.vocab_file = vocab_file
+        self.sp_model = spm.SentencePieceProcessor(**self.sp_model_kwargs)
+        self.sp_model.Load(vocab_file)
         super(BartTokenizer, self).__init__(
             do_lower_case=do_lower_case,
             remove_space=remove_space,
             **kwargs,
         )
     @property
     def vocab_size(self):
         return len(self.sp_model)