5d7cd0af907404e9456d35390dcd653f1b50a9fa4a0ec119b3a774070456e36c

Browse files

Files changed (8) hide show

README.md +61 -0
added_tokens.json +34 -0
config.json +33 -0
model.safetensors.index.json +750 -0
special_tokens_map.json +30 -0
tokenizer.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +311 -0

README.md ADDED Viewed

	@@ -0,0 +1,61 @@

+---
+language:
+- en
+license: apache-2.0
+tags:
+- Mistral
+- instruct
+- finetune
+- chatml
+- DPO
+- RLHF
+- gpt4
+- synthetic data
+- distillation
+- function calling
+- json mode
+- mlx
+base_model: NousResearch/Hermes-2-Pro-Mistral-7B
+datasets:
+- teknium/OpenHermes-2.5
+widget:
+- example_title: Hermes 2 Pro
+  messages:
+  - role: system
+    content: You are a sentient, superintelligent artificial general intelligence,
+      here to teach and assist me.
+  - role: user
+    content: Write a short story about Goku discovering kirby has teamed up with Majin
+      Buu to destroy the world.
+model-index:
+- name: Hermes-2-Pro-Mistral-7B
+  results: []
+---
+# mlx-community/Hermes-2-Pro-Mistral-7B-3bit
+The Model [mlx-community/Hermes-2-Pro-Mistral-7B-3bit](https://huggingface.co/mlx-community/Hermes-2-Pro-Mistral-7B-3bit) was
+converted to MLX format from [NousResearch/Hermes-2-Pro-Mistral-7B](https://huggingface.co/NousResearch/Hermes-2-Pro-Mistral-7B)
+using mlx-lm version **0.20.4**.
+## Use with mlx
+```bash
+pip install mlx-lm
+```
+```python
+from mlx_lm import load, generate
+model, tokenizer = load("mlx-community/Hermes-2-Pro-Mistral-7B-3bit")
+prompt="hello"
+if hasattr(tokenizer, "apply_chat_template") and tokenizer.chat_template is not None:
+    messages = [{"role": "user", "content": prompt}]
+    prompt = tokenizer.apply_chat_template(
+        messages, tokenize=False, add_generation_prompt=True
+    )
+response = generate(model, tokenizer, prompt=prompt, verbose=True)
+```

added_tokens.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "<pad10>": 32010,
+  "<pad11>": 32011,
+  "<pad12>": 32012,
+  "<pad13>": 32013,
+  "<pad14>": 32014,
+  "<pad15>": 32015,
+  "<pad16>": 32016,
+  "<pad17>": 32017,
+  "<pad18>": 32018,
+  "<pad19>": 32019,
+  "<pad20>": 32020,
+  "<pad21>": 32021,
+  "<pad22>": 32022,
+  "<pad23>": 32023,
+  "<pad24>": 32024,
+  "<pad25>": 32025,
+  "<pad26>": 32026,
+  "<pad27>": 32027,
+  "<pad28>": 32028,
+  "<pad29>": 32029,
+  "<pad2>": 32002,
+  "<pad30>": 32030,
+  "<pad31>": 32031,
+  "<pad3>": 32003,
+  "<pad4>": 32004,
+  "<pad5>": 32005,
+  "<pad6>": 32006,
+  "<pad7>": 32007,
+  "<pad8>": 32008,
+  "<pad9>": 32009,
+  "<|im_end|>": 32000,
+  "<|im_start|>": 32001
+}

config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+    "architectures": [
+        "MistralForCausalLM"
+    ],
+    "attention_dropout": 0.0,
+    "bos_token_id": 1,
+    "eos_token_id": 32000,
+    "hidden_act": "silu",
+    "hidden_size": 4096,
+    "initializer_range": 0.02,
+    "intermediate_size": 14336,
+    "max_position_embeddings": 32768,
+    "model_type": "mistral",
+    "num_attention_heads": 32,
+    "num_hidden_layers": 32,
+    "num_key_value_heads": 8,
+    "quantization": {
+        "group_size": 64,
+        "bits": 3
+    },
+    "quantization_config": {
+        "group_size": 64,
+        "bits": 3
+    },
+    "rms_norm_eps": 1e-05,
+    "rope_theta": 10000.0,
+    "sliding_window": 4096,
+    "tie_word_embeddings": false,
+    "torch_dtype": "bfloat16",
+    "transformers_version": "4.38.2",
+    "use_cache": false,
+    "vocab_size": 32032
+}

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,750 @@

+{
+    "metadata": {
+        "total_size": 3168788480
+    },
+    "weight_map": {
+        "lm_head.biases": "model.safetensors",
+        "lm_head.scales": "model.safetensors",
+        "lm_head.weight": "model.safetensors",
+        "model.embed_tokens.biases": "model.safetensors",
+        "model.embed_tokens.scales": "model.safetensors",
+        "model.embed_tokens.weight": "model.safetensors",
+        "model.layers.0.input_layernorm.weight": "model.safetensors",
+        "model.layers.0.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.0.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.0.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.0.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.0.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.0.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.0.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.0.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.0.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.0.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.0.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.0.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.0.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.0.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.0.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.0.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.0.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.0.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.0.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.0.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.0.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.0.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.1.input_layernorm.weight": "model.safetensors",
+        "model.layers.1.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.1.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.1.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.1.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.1.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.1.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.1.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.1.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.1.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.1.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.1.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.1.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.1.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.1.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.1.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.1.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.1.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.1.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.1.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.1.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.1.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.1.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.10.input_layernorm.weight": "model.safetensors",
+        "model.layers.10.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.10.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.10.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.10.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.10.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.10.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.10.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.10.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.10.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.10.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.10.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.10.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.10.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.10.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.10.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.10.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.10.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.10.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.10.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.10.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.10.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.10.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.11.input_layernorm.weight": "model.safetensors",
+        "model.layers.11.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.11.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.11.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.11.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.11.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.11.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.11.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.11.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.11.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.11.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.11.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.11.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.11.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.11.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.11.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.11.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.11.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.11.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.11.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.11.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.11.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.11.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.12.input_layernorm.weight": "model.safetensors",
+        "model.layers.12.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.12.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.12.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.12.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.12.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.12.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.12.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.12.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.12.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.12.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.12.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.12.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.12.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.12.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.12.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.12.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.12.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.12.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.12.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.12.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.12.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.12.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.13.input_layernorm.weight": "model.safetensors",
+        "model.layers.13.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.13.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.13.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.13.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.13.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.13.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.13.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.13.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.13.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.13.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.13.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.13.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.13.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.13.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.13.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.13.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.13.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.13.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.13.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.13.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.13.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.13.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.14.input_layernorm.weight": "model.safetensors",
+        "model.layers.14.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.14.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.14.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.14.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.14.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.14.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.14.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.14.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.14.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.14.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.14.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.14.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.14.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.14.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.14.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.14.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.14.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.14.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.14.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.14.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.14.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.14.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.15.input_layernorm.weight": "model.safetensors",
+        "model.layers.15.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.15.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.15.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.15.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.15.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.15.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.15.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.15.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.15.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.15.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.15.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.15.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.15.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.15.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.15.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.15.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.15.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.15.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.15.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.15.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.15.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.15.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.16.input_layernorm.weight": "model.safetensors",
+        "model.layers.16.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.16.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.16.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.16.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.16.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.16.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.16.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.16.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.16.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.16.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.16.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.16.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.16.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.16.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.16.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.16.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.16.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.16.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.16.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.16.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.16.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.16.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.17.input_layernorm.weight": "model.safetensors",
+        "model.layers.17.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.17.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.17.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.17.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.17.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.17.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.17.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.17.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.17.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.17.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.17.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.17.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.17.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.17.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.17.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.17.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.17.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.17.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.17.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.17.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.17.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.17.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.18.input_layernorm.weight": "model.safetensors",
+        "model.layers.18.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.18.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.18.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.18.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.18.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.18.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.18.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.18.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.18.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.18.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.18.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.18.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.18.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.18.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.18.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.18.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.18.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.18.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.18.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.18.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.18.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.18.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.19.input_layernorm.weight": "model.safetensors",
+        "model.layers.19.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.19.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.19.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.19.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.19.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.19.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.19.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.19.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.19.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.19.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.19.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.19.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.19.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.19.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.19.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.19.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.19.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.19.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.19.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.19.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.19.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.19.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.2.input_layernorm.weight": "model.safetensors",
+        "model.layers.2.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.2.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.2.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.2.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.2.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.2.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.2.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.2.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.2.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.2.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.2.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.2.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.2.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.2.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.2.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.2.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.2.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.2.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.2.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.2.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.2.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.2.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.20.input_layernorm.weight": "model.safetensors",
+        "model.layers.20.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.20.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.20.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.20.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.20.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.20.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.20.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.20.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.20.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.20.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.20.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.20.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.20.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.20.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.20.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.20.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.20.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.20.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.20.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.20.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.20.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.20.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.21.input_layernorm.weight": "model.safetensors",
+        "model.layers.21.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.21.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.21.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.21.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.21.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.21.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.21.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.21.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.21.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.21.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.21.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.21.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.21.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.21.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.21.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.21.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.21.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.21.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.21.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.21.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.21.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.21.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.22.input_layernorm.weight": "model.safetensors",
+        "model.layers.22.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.22.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.22.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.22.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.22.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.22.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.22.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.22.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.22.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.22.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.22.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.22.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.22.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.22.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.22.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.22.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.22.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.22.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.22.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.22.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.22.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.22.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.23.input_layernorm.weight": "model.safetensors",
+        "model.layers.23.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.23.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.23.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.23.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.23.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.23.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.23.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.23.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.23.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.23.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.23.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.23.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.23.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.23.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.23.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.23.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.23.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.23.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.23.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.23.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.23.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.23.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.24.input_layernorm.weight": "model.safetensors",
+        "model.layers.24.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.24.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.24.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.24.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.24.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.24.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.24.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.24.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.24.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.24.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.24.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.24.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.24.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.24.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.24.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.24.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.24.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.24.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.24.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.24.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.24.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.24.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.25.input_layernorm.weight": "model.safetensors",
+        "model.layers.25.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.25.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.25.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.25.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.25.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.25.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.25.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.25.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.25.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.25.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.25.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.25.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.25.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.25.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.25.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.25.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.25.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.25.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.25.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.25.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.25.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.25.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.26.input_layernorm.weight": "model.safetensors",
+        "model.layers.26.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.26.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.26.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.26.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.26.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.26.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.26.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.26.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.26.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.26.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.26.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.26.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.26.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.26.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.26.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.26.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.26.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.26.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.26.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.26.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.26.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.26.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.27.input_layernorm.weight": "model.safetensors",
+        "model.layers.27.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.27.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.27.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.27.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.27.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.27.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.27.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.27.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.27.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.27.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.27.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.27.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.27.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.27.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.27.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.27.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.27.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.27.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.27.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.27.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.27.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.27.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.28.input_layernorm.weight": "model.safetensors",
+        "model.layers.28.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.28.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.28.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.28.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.28.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.28.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.28.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.28.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.28.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.28.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.28.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.28.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.28.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.28.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.28.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.28.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.28.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.28.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.28.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.28.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.28.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.28.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.29.input_layernorm.weight": "model.safetensors",
+        "model.layers.29.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.29.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.29.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.29.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.29.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.29.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.29.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.29.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.29.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.29.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.29.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.29.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.29.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.29.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.29.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.29.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.29.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.29.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.29.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.29.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.29.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.29.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.3.input_layernorm.weight": "model.safetensors",
+        "model.layers.3.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.3.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.3.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.3.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.3.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.3.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.3.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.3.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.3.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.3.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.3.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.3.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.3.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.3.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.3.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.3.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.3.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.3.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.3.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.3.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.3.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.3.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.30.input_layernorm.weight": "model.safetensors",
+        "model.layers.30.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.30.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.30.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.30.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.30.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.30.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.30.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.30.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.30.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.30.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.30.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.30.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.30.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.30.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.30.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.30.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.30.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.30.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.30.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.30.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.30.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.30.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.31.input_layernorm.weight": "model.safetensors",
+        "model.layers.31.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.31.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.31.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.31.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.31.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.31.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.31.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.31.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.31.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.31.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.31.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.31.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.31.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.31.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.31.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.31.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.31.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.31.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.31.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.31.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.31.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.31.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.4.input_layernorm.weight": "model.safetensors",
+        "model.layers.4.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.4.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.4.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.4.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.4.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.4.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.4.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.4.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.4.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.4.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.4.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.4.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.4.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.4.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.4.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.4.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.4.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.4.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.4.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.4.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.4.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.4.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.5.input_layernorm.weight": "model.safetensors",
+        "model.layers.5.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.5.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.5.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.5.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.5.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.5.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.5.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.5.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.5.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.5.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.5.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.5.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.5.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.5.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.5.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.5.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.5.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.5.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.5.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.5.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.5.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.5.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.6.input_layernorm.weight": "model.safetensors",
+        "model.layers.6.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.6.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.6.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.6.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.6.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.6.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.6.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.6.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.6.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.6.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.6.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.6.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.6.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.6.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.6.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.6.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.6.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.6.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.6.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.6.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.6.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.6.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.7.input_layernorm.weight": "model.safetensors",
+        "model.layers.7.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.7.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.7.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.7.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.7.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.7.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.7.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.7.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.7.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.7.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.7.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.7.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.7.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.7.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.7.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.7.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.7.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.7.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.7.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.7.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.7.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.7.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.8.input_layernorm.weight": "model.safetensors",
+        "model.layers.8.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.8.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.8.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.8.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.8.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.8.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.8.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.8.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.8.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.8.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.8.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.8.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.8.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.8.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.8.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.8.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.8.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.8.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.8.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.8.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.8.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.8.self_attn.v_proj.weight": "model.safetensors",
+        "model.layers.9.input_layernorm.weight": "model.safetensors",
+        "model.layers.9.mlp.down_proj.biases": "model.safetensors",
+        "model.layers.9.mlp.down_proj.scales": "model.safetensors",
+        "model.layers.9.mlp.down_proj.weight": "model.safetensors",
+        "model.layers.9.mlp.gate_proj.biases": "model.safetensors",
+        "model.layers.9.mlp.gate_proj.scales": "model.safetensors",
+        "model.layers.9.mlp.gate_proj.weight": "model.safetensors",
+        "model.layers.9.mlp.up_proj.biases": "model.safetensors",
+        "model.layers.9.mlp.up_proj.scales": "model.safetensors",
+        "model.layers.9.mlp.up_proj.weight": "model.safetensors",
+        "model.layers.9.post_attention_layernorm.weight": "model.safetensors",
+        "model.layers.9.self_attn.k_proj.biases": "model.safetensors",
+        "model.layers.9.self_attn.k_proj.scales": "model.safetensors",
+        "model.layers.9.self_attn.k_proj.weight": "model.safetensors",
+        "model.layers.9.self_attn.o_proj.biases": "model.safetensors",
+        "model.layers.9.self_attn.o_proj.scales": "model.safetensors",
+        "model.layers.9.self_attn.o_proj.weight": "model.safetensors",
+        "model.layers.9.self_attn.q_proj.biases": "model.safetensors",
+        "model.layers.9.self_attn.q_proj.scales": "model.safetensors",
+        "model.layers.9.self_attn.q_proj.weight": "model.safetensors",
+        "model.layers.9.self_attn.v_proj.biases": "model.safetensors",
+        "model.layers.9.self_attn.v_proj.scales": "model.safetensors",
+        "model.layers.9.self_attn.v_proj.weight": "model.safetensors",
+        "model.norm.weight": "model.safetensors"
+    }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dadfd56d766715c61d2ef780a525ab43b8e6da4de6865bda3d95fdef5e134055
+size 493443

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,311 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "add_prefix_space": true,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32000": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32001": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32002": {
+      "content": "<pad2>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32003": {
+      "content": "<pad3>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32004": {
+      "content": "<pad4>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32005": {
+      "content": "<pad5>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32006": {
+      "content": "<pad6>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32007": {
+      "content": "<pad7>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32008": {
+      "content": "<pad8>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32009": {
+      "content": "<pad9>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32010": {
+      "content": "<pad10>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32011": {
+      "content": "<pad11>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32012": {
+      "content": "<pad12>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32013": {
+      "content": "<pad13>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32014": {
+      "content": "<pad14>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32015": {
+      "content": "<pad15>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32016": {
+      "content": "<pad16>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32017": {
+      "content": "<pad17>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32018": {
+      "content": "<pad18>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32019": {
+      "content": "<pad19>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32020": {
+      "content": "<pad20>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32021": {
+      "content": "<pad21>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32022": {
+      "content": "<pad22>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32023": {
+      "content": "<pad23>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32024": {
+      "content": "<pad24>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32025": {
+      "content": "<pad25>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32026": {
+      "content": "<pad26>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32027": {
+      "content": "<pad27>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32028": {
+      "content": "<pad28>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32029": {
+      "content": "<pad29>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32030": {
+      "content": "<pad30>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "32031": {
+      "content": "<pad31>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    }
+  },
+  "additional_special_tokens": [],
+  "bos_token": "<s>",
+  "chat_template": [
+    {
+      "name": "default",
+      "template": "{{bos_token}}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}"
+    },
+    {
+      "name": "tool_use",
+      "template": "{%- macro json_to_python_type(json_spec) %}\n{%- set basic_type_map = {\n    \"string\": \"str\",\n    \"number\": \"float\",\n    \"integer\": \"int\",\n    \"boolean\": \"bool\"\n} %}\n\n{%- if basic_type_map[json_spec.type] is defined %}\n    {{- basic_type_map[json_spec.type] }}\n{%- elif json_spec.type == \"array\" %}\n    {{- \"list[\" +  json_to_python_type(json_spec|items) + \"]\"}}\n{%- elif json_spec.type == \"object\" %}\n    {%- if json_spec.additionalProperties is defined %}\n        {{- \"dict[str, \" + json_to_python_type(json_spec.additionalProperties) + ']'}}\n    {%- else %}\n        {{- \"dict\" }}\n    {%- endif %}\n{%- elif json_spec.type is iterable %}\n    {{- \"Union[\" }}\n    {%- for t in json_spec.type %}\n      {{- json_to_python_type({\"type\": t}) }}\n      {%- if not loop.last %}\n        {{- \",\" }} \n    {%- endif %}\n    {%- endfor %}\n    {{- \"]\" }}\n{%- else %}\n    {{- \"Any\" }}\n{%- endif %}\n{%- endmacro %}\n\n\n{{- bos_token }}\n{{- '<|im_start|>system\n' }}\n{{- \"You are a function calling AI model. You are provided with function signatures within <tools></tools> XML tags. You may call one or more functions to assist with the user query. Don't make assumptions about what values to plug into functions. Here are the available tools: <tools> \" }}\n{%- for tool in tools %}\n    {%- if tool.function is defined %}\n        {%- set tool = tool.function %}\n    {%- endif %}\n    {{- '{\"type\": \"function\", \"function\": ' }}\n    {{- '{\"name\": \"' + tool.name + '\", ' }}\n    {{- '\"description\": \"' + tool.name + '(' }}\n    {%- for param_name, param_fields in tool.parameters.properties|items %}\n        {{- param_name + \": \" + json_to_python_type(param_fields) }}\n        {%- if not loop.last %}\n            {{- \", \" }}\n        {%- endif %}\n    {%- endfor %}\n    {{- \")\" }}\n    {%- if tool.return is defined %}\n        {{- \" -> \" + json_to_python_type(tool.return) }}\n    {%- endif %}\n    {{- \" - \" + tool.description + \"\n\n\" }}\n    {%- for param_name, param_fields in tool.parameters.properties|items %}\n        {%- if loop.first %}\n            {{- \"    Args:\n\" }}\n        {%- endif %}\n        {{- \"        \" + param_name + \"(\" + json_to_python_type(param_fields) + \"): \" + param_fields.description|trim }}\n    {%- endfor %}\n    {%- if tool.return is defined and tool.return.description is defined %}\n        {{- \"\n    Returns:\n        \" + tool.return.description }}\n    {%- endif %}\n    {{- '\"' }}\n    {{- ', \"parameters\": ' }}\n    {%- if tool.parameters.properties | length == 0 %}\n        {{- \"{}\" }}\n    {%- else %}\n        {{- tool.parameters|tojson }}\n    {%- endif %}\n    {{- \"}\" }}\n    {%- if not loop.last %}\n        {{- \"\n\" }}\n    {%- endif %}\n{%- endfor %}\n{{- \" </tools>\" }}\n{{- 'Use the following pydantic model json schema for each tool call you will make: {\"properties\": {\"name\": {\"title\": \"Name\", \"type\": \"string\"}, \"arguments\": {\"title\": \"Arguments\", \"type\": \"object\"}}, \"required\": [\"name\", \"arguments\"], \"title\": \"FunctionCall\", \"type\": \"object\"}}\n' }}\n{{- \"For each function call return a json object with function name and arguments within <tool_call></tool_call> XML tags as follows:\n\" }}\n{{- \"<tool_call>\n\" }}\n{{- '{\"name\": <function-name>, \"arguments\": <args-dict>}\n' }}\n{{- '</tool_call><|im_end|>\n' }}\n{%- for message in messages %}\n    {%- if message.role == \"user\" or message.role == \"system\" or (message.role == \"assistant\" and message.tool_calls is not defined) %}\n        {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}\n    {%- elif message.role == \"assistant\" %}\n        {{- '<|im_start|>' + message.role }}\n    {%- for tool_call in message.tool_calls %}\n       {{- '\n<tool_call>\n' }}           {%- if tool_call.function is defined %}\n                {%- set tool_call = tool_call.function %}\n            {%- endif %}\n            {{- '{' }}\n            {{- '\"name\": \"' }}\n            {{- tool_call.name }}\n            {{- '\"' }}\n            {{- ', '}}\n            {%- if tool_call.arguments is defined %}\n                {{- '\"arguments\": ' }}\n                {%- if tool_call.arguments is string %}\n                    {{- tool_call.arguments }}\n                {%- else %}\n                    {{- tool_call.arguments|tojson }}\n                {%- endif %}\n            {%- endif %}\n             {{- '}' }}\n            {{- '\n</tool_call>' }}\n    {%- endfor %}\n        {{- '<|im_end|>\n' }}\n    {%- elif message.role == \"tool\" %}\n        {%- if loop.previtem and loop.previtem.role != \"tool\" %}\n            {{- '<|im_start|>tool\n' }}\n        {%- endif %}\n        {{- '<tool_response>\n' }}\n        {{- message.content }}\n        {%- if not loop.last %}\n            {{- '\n</tool_response>\n' }}\n        {%- else %}\n            {{- '\n</tool_response>' }}\n        {%- endif %}\n        {%- if not loop.last and loop.nextitem.role != \"tool\" %}\n            {{- '<|im_end|>' }}\n        {%- elif loop.last %}\n            {{- '<|im_end|>' }}\n        {%- endif %}\n    {%- endif %}\n{%- endfor %}\n{%- if add_generation_prompt %}\n    {{- '<|im_start|>assistant\n' }}\n{%- endif %}\n"
+    }
+  ],
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|im_end|>",
+  "extra_special_tokens": {},
+  "legacy": true,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": false,
+  "use_fast": true
+}