ai-forever
/

ruGPT-3.5-13B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ai-forever commited on Dec 5, 2023

Commit

64b1153

·

1 Parent(s): 0101459

Align model config with tokenizer settings

Files changed (3) hide show

config.json +3 -2
generation_config.json +3 -2
tokenizer_config.json +3 -1

config.json CHANGED Viewed

@@ -4,9 +4,9 @@
     "GPT2LMHeadModel"
   ],
   "attn_pdrop": 0.1,
-  "bos_token_id": 50256,
   "embd_pdrop": 0.1,
-  "eos_token_id": 50256,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt2",
@@ -16,6 +16,7 @@
   "n_inner": null,
   "n_layer": 40,
   "n_positions": 2048,
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "scale_attn_by_inverse_layer_idx": false,

     "GPT2LMHeadModel"
   ],
   "attn_pdrop": 0.1,
+  "bos_token_id": 2,
   "embd_pdrop": 0.1,
+  "eos_token_id": 3,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt2",
   "n_inner": null,
   "n_layer": 40,
   "n_positions": 2048,
+  "pad_token_id": 0,
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "scale_attn_by_inverse_layer_idx": false,

generation_config.json CHANGED Viewed

@@ -1,6 +1,7 @@
 {
   "_from_model_config": true,
-  "bos_token_id": 50256,
-  "eos_token_id": 50256,
   "transformers_version": "4.27.1"
 }

 {
   "_from_model_config": true,
+  "bos_token_id": 2,
+  "eos_token_id": 3,
+  "pad_token_id": 0,
   "transformers_version": "4.27.1"
 }

tokenizer_config.json CHANGED Viewed

@@ -20,7 +20,7 @@
   },
   "errors": "replace",
   "mask_token": "<mask>",
-  "model_max_length": 1000000000000000019884624838656,
   "pad_token": {
     "__type": "AddedToken",
     "content": "<pad>",
@@ -29,7 +29,9 @@
     "rstrip": false,
     "single_word": false
   },
   "tokenizer_class": "GPT2Tokenizer",
   "unk_token": {
     "__type": "AddedToken",
     "content": "<|endoftext|>",

   },
   "errors": "replace",
   "mask_token": "<mask>",
+  "model_max_length": 2048,
   "pad_token": {
     "__type": "AddedToken",
     "content": "<pad>",
     "rstrip": false,
     "single_word": false
   },
+  "padding_side": "left",
   "tokenizer_class": "GPT2Tokenizer",
+  "truncation_side": "left",
   "unk_token": {
     "__type": "AddedToken",
     "content": "<|endoftext|>",