9b735fbe7433c2277099e22854a378930dfcd6f5e2977151d85b01e20e53db7b

Browse files

Files changed (7) hide show

README.md +29 -0
config.json +128 -0
model.safetensors +3 -0
model.safetensors.index.json +459 -0
special_tokens_map.json +23 -0
tokenizer.json +0 -0
tokenizer_config.json +41 -0

README.md ADDED Viewed

	@@ -0,0 +1,29 @@

+---
+license: other
+tags:
+- trl
+- sft
+- generated_from_trainer
+- mlx
+base_model: apple/OpenELM-1_1B-Instruct
+model-index:
+- name: OpenELM_1.1b_UiRev_finetuned_V2
+  results: []
+---
+# Paramstr/MLX_OpenELM_1.1b_UiRev_finetuned_V3
+The Model [Paramstr/MLX_OpenELM_1.1b_UiRev_finetuned_V3](https://huggingface.co/Paramstr/MLX_OpenELM_1.1b_UiRev_finetuned_V3) was converted to MLX format from [Paramstr/OpenELM_1.1b_UiRev_finetuned_V2](https://huggingface.co/Paramstr/OpenELM_1.1b_UiRev_finetuned_V2) using mlx-lm version **0.14.2**.
+## Use with mlx
+```bash
+pip install mlx-lm
+```
+```python
+from mlx_lm import load, generate
+model, tokenizer = load("Paramstr/MLX_OpenELM_1.1b_UiRev_finetuned_V3")
+response = generate(model, tokenizer, prompt="hello", verbose=True)
+```

config.json ADDED Viewed

	@@ -0,0 +1,128 @@

+{
+    "activation_fn_name": "swish",
+    "architectures": [
+        "OpenELMForCausalLM"
+    ],
+    "auto_map": {
+        "AutoConfig": "apple/OpenELM-1_1B-Instruct--configuration_openelm.OpenELMConfig",
+        "AutoModelForCausalLM": "apple/OpenELM-1_1B-Instruct--modeling_openelm.OpenELMForCausalLM"
+    },
+    "bos_token_id": 1,
+    "eos_token_id": 2,
+    "ffn_dim_divisor": 256,
+    "ffn_multipliers": [
+        0.5,
+        0.63,
+        0.76,
+        0.89,
+        1.02,
+        1.15,
+        1.28,
+        1.41,
+        1.54,
+        1.67,
+        1.8,
+        1.93,
+        2.06,
+        2.19,
+        2.31,
+        2.44,
+        2.57,
+        2.7,
+        2.83,
+        2.96,
+        3.09,
+        3.22,
+        3.35,
+        3.48,
+        3.61,
+        3.74,
+        3.87,
+        4.0
+    ],
+    "ffn_with_glu": true,
+    "head_dim": 64,
+    "initializer_range": 0.02,
+    "max_context_length": 2048,
+    "model_dim": 2048,
+    "model_type": "openelm",
+    "normalization_layer_name": "rms_norm",
+    "normalize_qk_projections": true,
+    "num_gqa_groups": 4,
+    "num_kv_heads": [
+        4,
+        4,
+        4,
+        5,
+        5,
+        5,
+        5,
+        5,
+        5,
+        5,
+        6,
+        6,
+        6,
+        6,
+        6,
+        6,
+        6,
+        6,
+        7,
+        7,
+        7,
+        7,
+        7,
+        7,
+        8,
+        8,
+        8,
+        8
+    ],
+    "num_query_heads": [
+        16,
+        16,
+        16,
+        20,
+        20,
+        20,
+        20,
+        20,
+        20,
+        20,
+        24,
+        24,
+        24,
+        24,
+        24,
+        24,
+        24,
+        24,
+        28,
+        28,
+        28,
+        28,
+        28,
+        28,
+        32,
+        32,
+        32,
+        32
+    ],
+    "num_transformer_layers": 28,
+    "qkv_multipliers": [
+        0.5,
+        1.0
+    ],
+    "quantization": {
+        "group_size": 64,
+        "bits": 4
+    },
+    "rope_freq_constant": 10000,
+    "rope_max_length": 4096,
+    "share_input_output_layers": true,
+    "torch_dtype": "float32",
+    "transformers_version": "4.40.1",
+    "use_cache": true,
+    "vocab_size": 32000
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83851b0c2e163eea7b1c7f133a45b64b13b670ee4dc0ada792043eab5a0e2397
+size 607662906

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,459 @@

+{
+    "metadata": {
+        "total_size": 607611904
+    },
+    "weight_map": {
+        "transformer.layers.0.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.0.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.0.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.0.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.0.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.0.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.0.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.0.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.0.attn_norm.weight": "model.safetensors",
+        "transformer.layers.0.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.0.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.0.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.0.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.0.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.0.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.0.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.1.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.1.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.1.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.1.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.1.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.1.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.1.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.1.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.1.attn_norm.weight": "model.safetensors",
+        "transformer.layers.1.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.1.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.1.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.1.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.1.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.1.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.1.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.10.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.10.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.10.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.10.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.10.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.10.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.10.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.10.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.10.attn_norm.weight": "model.safetensors",
+        "transformer.layers.10.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.10.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.10.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.10.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.10.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.10.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.10.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.11.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.11.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.11.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.11.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.11.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.11.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.11.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.11.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.11.attn_norm.weight": "model.safetensors",
+        "transformer.layers.11.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.11.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.11.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.11.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.11.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.11.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.11.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.12.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.12.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.12.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.12.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.12.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.12.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.12.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.12.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.12.attn_norm.weight": "model.safetensors",
+        "transformer.layers.12.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.12.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.12.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.12.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.12.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.12.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.12.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.13.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.13.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.13.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.13.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.13.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.13.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.13.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.13.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.13.attn_norm.weight": "model.safetensors",
+        "transformer.layers.13.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.13.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.13.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.13.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.13.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.13.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.13.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.14.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.14.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.14.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.14.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.14.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.14.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.14.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.14.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.14.attn_norm.weight": "model.safetensors",
+        "transformer.layers.14.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.14.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.14.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.14.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.14.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.14.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.14.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.15.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.15.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.15.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.15.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.15.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.15.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.15.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.15.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.15.attn_norm.weight": "model.safetensors",
+        "transformer.layers.15.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.15.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.15.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.15.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.15.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.15.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.15.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.16.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.16.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.16.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.16.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.16.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.16.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.16.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.16.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.16.attn_norm.weight": "model.safetensors",
+        "transformer.layers.16.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.16.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.16.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.16.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.16.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.16.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.16.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.17.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.17.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.17.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.17.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.17.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.17.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.17.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.17.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.17.attn_norm.weight": "model.safetensors",
+        "transformer.layers.17.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.17.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.17.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.17.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.17.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.17.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.17.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.18.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.18.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.18.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.18.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.18.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.18.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.18.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.18.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.18.attn_norm.weight": "model.safetensors",
+        "transformer.layers.18.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.18.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.18.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.18.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.18.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.18.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.18.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.19.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.19.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.19.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.19.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.19.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.19.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.19.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.19.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.19.attn_norm.weight": "model.safetensors",
+        "transformer.layers.19.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.19.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.19.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.19.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.19.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.19.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.19.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.2.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.2.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.2.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.2.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.2.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.2.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.2.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.2.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.2.attn_norm.weight": "model.safetensors",
+        "transformer.layers.2.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.2.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.2.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.2.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.2.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.2.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.2.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.20.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.20.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.20.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.20.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.20.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.20.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.20.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.20.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.20.attn_norm.weight": "model.safetensors",
+        "transformer.layers.20.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.20.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.20.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.20.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.20.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.20.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.20.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.21.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.21.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.21.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.21.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.21.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.21.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.21.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.21.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.21.attn_norm.weight": "model.safetensors",
+        "transformer.layers.21.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.21.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.21.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.21.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.21.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.21.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.21.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.22.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.22.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.22.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.22.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.22.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.22.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.22.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.22.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.22.attn_norm.weight": "model.safetensors",
+        "transformer.layers.22.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.22.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.22.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.22.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.22.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.22.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.22.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.23.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.23.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.23.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.23.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.23.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.23.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.23.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.23.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.23.attn_norm.weight": "model.safetensors",
+        "transformer.layers.23.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.23.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.23.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.23.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.23.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.23.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.23.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.24.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.24.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.24.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.24.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.24.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.24.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.24.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.24.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.24.attn_norm.weight": "model.safetensors",
+        "transformer.layers.24.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.24.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.24.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.24.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.24.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.24.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.24.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.25.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.25.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.25.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.25.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.25.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.25.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.25.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.25.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.25.attn_norm.weight": "model.safetensors",
+        "transformer.layers.25.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.25.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.25.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.25.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.25.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.25.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.25.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.26.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.26.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.26.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.26.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.26.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.26.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.26.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.26.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.26.attn_norm.weight": "model.safetensors",
+        "transformer.layers.26.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.26.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.26.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.26.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.26.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.26.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.26.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.27.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.27.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.27.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.27.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.27.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.27.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.27.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.27.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.27.attn_norm.weight": "model.safetensors",
+        "transformer.layers.27.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.27.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.27.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.27.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.27.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.27.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.27.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.3.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.3.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.3.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.3.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.3.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.3.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.3.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.3.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.3.attn_norm.weight": "model.safetensors",
+        "transformer.layers.3.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.3.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.3.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.3.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.3.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.3.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.3.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.4.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.4.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.4.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.4.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.4.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.4.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.4.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.4.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.4.attn_norm.weight": "model.safetensors",
+        "transformer.layers.4.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.4.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.4.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.4.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.4.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.4.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.4.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.5.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.5.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.5.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.5.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.5.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.5.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.5.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.5.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.5.attn_norm.weight": "model.safetensors",
+        "transformer.layers.5.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.5.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.5.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.5.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.5.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.5.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.5.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.6.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.6.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.6.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.6.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.6.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.6.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.6.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.6.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.6.attn_norm.weight": "model.safetensors",
+        "transformer.layers.6.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.6.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.6.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.6.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.6.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.6.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.6.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.7.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.7.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.7.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.7.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.7.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.7.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.7.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.7.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.7.attn_norm.weight": "model.safetensors",
+        "transformer.layers.7.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.7.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.7.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.7.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.7.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.7.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.7.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.8.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.8.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.8.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.8.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.8.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.8.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.8.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.8.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.8.attn_norm.weight": "model.safetensors",
+        "transformer.layers.8.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.8.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.8.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.8.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.8.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.8.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.8.ffn_norm.weight": "model.safetensors",
+        "transformer.layers.9.attn.k_norm.weight": "model.safetensors",
+        "transformer.layers.9.attn.out_proj.biases": "model.safetensors",
+        "transformer.layers.9.attn.out_proj.scales": "model.safetensors",
+        "transformer.layers.9.attn.out_proj.weight": "model.safetensors",
+        "transformer.layers.9.attn.q_norm.weight": "model.safetensors",
+        "transformer.layers.9.attn.qkv_proj.biases": "model.safetensors",
+        "transformer.layers.9.attn.qkv_proj.scales": "model.safetensors",
+        "transformer.layers.9.attn.qkv_proj.weight": "model.safetensors",
+        "transformer.layers.9.attn_norm.weight": "model.safetensors",
+        "transformer.layers.9.ffn.proj_1.biases": "model.safetensors",
+        "transformer.layers.9.ffn.proj_1.scales": "model.safetensors",
+        "transformer.layers.9.ffn.proj_1.weight": "model.safetensors",
+        "transformer.layers.9.ffn.proj_2.biases": "model.safetensors",
+        "transformer.layers.9.ffn.proj_2.scales": "model.safetensors",
+        "transformer.layers.9.ffn.proj_2.weight": "model.safetensors",
+        "transformer.layers.9.ffn_norm.weight": "model.safetensors",
+        "transformer.norm.weight": "model.safetensors",
+        "transformer.token_embeddings.biases": "model.safetensors",
+        "transformer.token_embeddings.scales": "model.safetensors",
+        "transformer.token_embeddings.weight": "model.safetensors"
+    }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": null,
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": false
+}