End of training

Files changed (8) hide show

.gitattributes ADDED Viewed


1	+ pytorch_model.bin filter=lfs diff=lfs merge=lfs -text
2	+ training_args.bin filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

config.json CHANGED Viewed

@@ -37,7 +37,7 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.20.1",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 32005

   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.30.2",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 32005

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:333761c1fb1556877821522040d3716b3fc7bb26930791d08f9f4474f75a1382
+size 1342611565

sentencepiece.bpe.model CHANGED Viewed

Binary files a/sentencepiece.bpe.model and b/sentencepiece.bpe.model differ

tokenizer.json CHANGED Viewed

@@ -5,66 +5,66 @@
   "added_tokens": [
     {
       "id": 0,
-      "special": true,
       "content": "<s>NOTUSED",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false
     },
     {
       "id": 1,
-      "special": true,
       "content": "<pad>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false
     },
     {
       "id": 2,
-      "special": true,
       "content": "</s>NOTUSED",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false
     },
     {
       "id": 3,
-      "special": true,
       "content": "<unk>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false
     },
     {
       "id": 5,
-      "special": true,
       "content": "<s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false
     },
     {
       "id": 6,
-      "special": true,
       "content": "</s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false
     },
     {
       "id": 32004,
-      "special": true,
       "content": "<mask>",
       "single_word": false,
       "lstrip": true,
       "rstrip": false,
-      "normalized": true
     }
   ],
   "normalizer": {

   "added_tokens": [
     {
       "id": 0,
       "content": "<s>NOTUSED",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false,
+      "special": true
     },
     {
       "id": 1,
       "content": "<pad>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false,
+      "special": true
     },
     {
       "id": 2,
       "content": "</s>NOTUSED",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false,
+      "special": true
     },
     {
       "id": 3,
       "content": "<unk>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false,
+      "special": true
     },
     {
       "id": 5,
       "content": "<s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false,
+      "special": true
     },
     {
       "id": 6,
       "content": "</s>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
+      "normalized": false,
+      "special": true
     },
     {
       "id": 32004,
       "content": "<mask>",
       "single_word": false,
       "lstrip": true,
       "rstrip": false,
+      "normalized": true,
+      "special": true
     }
   ],
   "normalizer": {

tokenizer_config.json CHANGED Viewed

@@ -4,6 +4,7 @@
     "</s>NOTUSED"
   ],
   "bos_token": "<s>",
   "cls_token": "<s>",
   "eos_token": "</s>",
   "mask_token": {
@@ -14,11 +15,10 @@
     "rstrip": false,
     "single_word": false
   },
-  "name_or_path": "camembert/camembert-large",
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "sp_model_kwargs": {},
-  "special_tokens_map_file": null,
   "tokenizer_class": "CamembertTokenizer",
   "unk_token": "<unk>"
 }

     "</s>NOTUSED"
   ],
   "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
   "cls_token": "<s>",
   "eos_token": "</s>",
   "mask_token": {
     "rstrip": false,
     "single_word": false
   },
+  "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "sp_model_kwargs": {},
   "tokenizer_class": "CamembertTokenizer",
   "unk_token": "<unk>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:03cc59526da8166036f5dd656c548647fedc1d2cf71889d9698b66d9c8e62f11
-size 3375

 version https://git-lfs.github.com/spec/v1
+oid sha256:e91693c446d53b538d917698d366e08655a0cb5fc7b011ba2ec7bb464ee1ad8f
+size 4027