Upload folder using huggingface_hub

Browse files

Files changed (11) hide show

README.md +68 -0
config.json +41 -0
generation_config.json +7 -0
model-00001-of-00003.safetensors +3 -0
model-00002-of-00003.safetensors +3 -0
model-00003-of-00003.safetensors +3 -0
model.safetensors.index.json +554 -0
pytorch_model.bin.index.json +554 -0
special_tokens_map.json +38 -0
tokenizer.model +3 -0
tokenizer_config.json +98 -0

README.md ADDED Viewed

	@@ -0,0 +1,68 @@

+---
+license: apache-2.0
+pipeline_tag: text-generation
+---
+<div align="center">
+  <img src="https://raw.githubusercontent.com/InternLM/lmdeploy/0be9e7ab6fe9a066cfb0a09d0e0c8d2e28435e58/resources/lmdeploy-logo.svg" width="450"/>
+</div>
+# INT4 Weight-only Quantization and Deployment (W4A16)
+LMDeploy adopts [AWQ](https://arxiv.org/abs/2306.00978) algorithm for 4bit weight-only quantization. By developed the high-performance cuda kernel, the 4bit quantized model inference achieves up to 2.4x faster than FP16.
+LMDeploy supports the following NVIDIA GPU for W4A16 inference:
+- Turing(sm75): 20 series, T4
+- Ampere(sm80,sm86): 30 series, A10, A16, A30, A100
+- Ada Lovelace(sm90): 40 series
+Before proceeding with the quantization and inference, please ensure that lmdeploy is installed.
+```shell
+pip install lmdeploy[all]
+```
+This article comprises the following sections:
+<!-- toc -->
+- [Inference](#inference)
+- [Evaluation](#evaluation)
+- [Service](#service)
+<!-- tocstop -->
+## Inference
+Trying the following codes, you can perform the batched offline inference with the quantized model:
+```python
+from lmdeploy import pipeline, TurbomindEngineConfig
+engine_config = TurbomindEngineConfig(model_format='awq')
+pipe = pipeline("internlm/internlm2_5-7b-chat-4bit", backend_config=engine_config)
+response = pipe(["Hi, pls intro yourself", "Shanghai is"])
+print(response)
+```
+For more information about the pipeline parameters, please refer to [here](https://github.com/InternLM/lmdeploy/blob/main/docs/en/inference/pipeline.md).
+## Evaluation
+Please overview [this guide](https://opencompass.readthedocs.io/en/latest/advanced_guides/evaluation_turbomind.html) about model evaluation with LMDeploy.
+## Service
+LMDeploy's `api_server` enables models to be easily packed into services with a single command. The provided RESTful APIs are compatible with OpenAI's interfaces. Below are an example of service startup:
+```shell
+lmdeploy serve api_server internlm/internlm2_5-7b-chat-4bit --backend turbomind --model-format awq
+```
+The default port of `api_server` is `23333`. After the server is launched, you can communicate with server on terminal through `api_client`:
+```shell
+lmdeploy serve api_client http://0.0.0.0:23333
+```
+You can overview and try out `api_server` APIs online by swagger UI at `http://0.0.0.0:23333`, or you can also read the API specification from [here](https://github.com/InternLM/lmdeploy/blob/main/docs/en/serving/restful_api.md).

config.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "_name_or_path": "/nvme/shared_data/InternLM/internlm2_5-7b-chat",
+  "architectures": [
+    "InternLM2ForCausalLM"
+  ],
+  "attn_implementation": "eager",
+  "auto_map": {
+    "AutoConfig": "configuration_internlm2.InternLM2Config",
+    "AutoModel": "modeling_internlm2.InternLM2ForCausalLM",
+    "AutoModelForCausalLM": "modeling_internlm2.InternLM2ForCausalLM"
+  },
+  "bias": false,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "fp16": true,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 32768,
+  "model_type": "internlm2",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pad_token_id": 2,
+  "quantization_config": {
+    "bits": 4,
+    "group_size": 128,
+    "quant_method": "awq",
+    "version": "gemm",
+    "zero_point": true
+  },
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 1000000,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.40.1",
+  "use_cache": false,
+  "vocab_size": 92544
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "pad_token_id": 2,
+  "transformers_version": "4.40.1"
+}

model-00001-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63a15cf6767b864b7a395b9874682275ae524a3eb998bf98d1efeaba4a5084d1
+size 1384550088

model-00002-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:123bc6a3ff4c4822104b6529eda73af9e3dec0067e1d45c1742af1c8c25320df
+size 1019380312

model-00003-of-00003.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed0ad632fc20940e6fb47c123769fc3ba86b60461c95f53c4adbfceffd4390d3
+size 980417432

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,554 @@

+{
+    "metadata": {
+        "total_size": 5142749184
+    },
+    "weight_map": {
+        "model.layers.0.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.0.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.0.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.0.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.0.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.0.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.0.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.0.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.0.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.1.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.1.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.1.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.1.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.1.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.1.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.1.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.1.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.1.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.10.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.10.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.10.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.10.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.10.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.10.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.10.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.10.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.10.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.10.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.10.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.10.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.10.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.10.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.10.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.10.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.10.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.11.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.11.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.11.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.11.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.11.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.11.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.11.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.11.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.11.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.12.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.12.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.12.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.12.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.12.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.12.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.12.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.12.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.12.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.13.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.13.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.13.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.13.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.13.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.13.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.13.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.13.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.13.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.14.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.14.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.14.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.14.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.14.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.14.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.14.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.14.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.14.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.15.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.15.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.15.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.15.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.15.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.15.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.15.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.15.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.15.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.16.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.16.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.16.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.16.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.16.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.16.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.16.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.16.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.16.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.17.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.17.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.17.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.17.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.17.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.17.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.17.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.17.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.17.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.18.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.18.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.18.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.18.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.18.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.18.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.18.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.18.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.18.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.19.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.19.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.19.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.19.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.19.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.19.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.19.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.19.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.19.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.2.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.2.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.2.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.2.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.2.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.2.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.2.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.2.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.2.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.20.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.20.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.20.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.20.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.20.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.20.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.20.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.20.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.20.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.21.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.21.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.21.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.21.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.21.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.21.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.21.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.21.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.21.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.22.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.22.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.22.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.22.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.22.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.22.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.22.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.22.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.22.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.23.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.23.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.23.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.23.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.23.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.23.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.23.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.23.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.23.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.24.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.24.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.24.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.24.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.24.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.24.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.24.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.24.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.24.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.25.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.25.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.25.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.25.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.25.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.25.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.25.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.25.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.25.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.26.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.26.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.26.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.26.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.26.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.26.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.26.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.26.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.26.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.27.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.27.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.27.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.27.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.27.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.27.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.27.attention_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w1.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w1.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w1.scales": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w2.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w2.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w2.scales": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w3.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w3.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.27.feed_forward.w3.scales": "model-00002-of-00003.safetensors",
+        "model.layers.27.ffn_norm.weight": "model-00002-of-00003.safetensors",
+        "model.layers.28.attention.wo.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.28.attention.wo.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.28.attention.wo.scales": "model-00002-of-00003.safetensors",
+        "model.layers.28.attention.wqkv.qweight": "model-00002-of-00003.safetensors",
+        "model.layers.28.attention.wqkv.qzeros": "model-00002-of-00003.safetensors",
+        "model.layers.28.attention.wqkv.scales": "model-00002-of-00003.safetensors",
+        "model.layers.28.attention_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w1.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w1.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w1.scales": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w2.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w2.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w2.scales": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w3.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w3.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.28.feed_forward.w3.scales": "model-00003-of-00003.safetensors",
+        "model.layers.28.ffn_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.29.attention.wo.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.29.attention.wo.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.29.attention.wo.scales": "model-00003-of-00003.safetensors",
+        "model.layers.29.attention.wqkv.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.29.attention.wqkv.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.29.attention.wqkv.scales": "model-00003-of-00003.safetensors",
+        "model.layers.29.attention_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w1.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w1.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w1.scales": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w2.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w2.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w2.scales": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w3.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w3.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.29.feed_forward.w3.scales": "model-00003-of-00003.safetensors",
+        "model.layers.29.ffn_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.3.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.3.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.3.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.3.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.3.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.3.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.3.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.3.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.3.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.30.attention.wo.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.30.attention.wo.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.30.attention.wo.scales": "model-00003-of-00003.safetensors",
+        "model.layers.30.attention.wqkv.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.30.attention.wqkv.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.30.attention.wqkv.scales": "model-00003-of-00003.safetensors",
+        "model.layers.30.attention_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w1.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w1.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w1.scales": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w2.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w2.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w2.scales": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w3.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w3.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.30.feed_forward.w3.scales": "model-00003-of-00003.safetensors",
+        "model.layers.30.ffn_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.31.attention.wo.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.31.attention.wo.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.31.attention.wo.scales": "model-00003-of-00003.safetensors",
+        "model.layers.31.attention.wqkv.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.31.attention.wqkv.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.31.attention.wqkv.scales": "model-00003-of-00003.safetensors",
+        "model.layers.31.attention_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w1.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w1.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w1.scales": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w2.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w2.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w2.scales": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w3.qweight": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w3.qzeros": "model-00003-of-00003.safetensors",
+        "model.layers.31.feed_forward.w3.scales": "model-00003-of-00003.safetensors",
+        "model.layers.31.ffn_norm.weight": "model-00003-of-00003.safetensors",
+        "model.layers.4.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.4.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.4.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.4.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.4.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.4.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.4.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.4.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.4.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.5.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.5.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.5.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.5.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.5.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.5.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.5.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.5.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.5.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.6.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.6.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.6.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.6.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.6.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.6.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.6.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.6.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.6.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.7.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.7.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.7.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.7.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.7.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.7.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.7.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.7.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.7.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.8.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.8.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.8.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.8.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.8.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.8.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.8.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.8.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.8.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.9.attention.wo.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.9.attention.wo.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.9.attention.wo.scales": "model-00001-of-00003.safetensors",
+        "model.layers.9.attention.wqkv.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.9.attention.wqkv.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.9.attention.wqkv.scales": "model-00001-of-00003.safetensors",
+        "model.layers.9.attention_norm.weight": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w1.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w1.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w1.scales": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w2.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w2.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w2.scales": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w3.qweight": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w3.qzeros": "model-00001-of-00003.safetensors",
+        "model.layers.9.feed_forward.w3.scales": "model-00001-of-00003.safetensors",
+        "model.layers.9.ffn_norm.weight": "model-00001-of-00003.safetensors",
+        "model.norm.weight": "model-00003-of-00003.safetensors",
+        "model.tok_embeddings.weight": "model-00001-of-00003.safetensors",
+        "output.weight": "model-00003-of-00003.safetensors"
+    }
+}

pytorch_model.bin.index.json ADDED Viewed

	@@ -0,0 +1,554 @@

+{
+  "metadata": {
+    "total_size": 5142749184
+  },
+  "weight_map": {
+    "model.layers.0.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.0.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.1.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.10.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.10.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.10.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.10.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.10.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.11.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.12.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.13.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.14.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.15.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.16.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.17.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.18.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.19.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.2.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.2.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.20.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.20.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.21.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.22.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.23.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.24.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.25.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.26.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.attention_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w1.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w1.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w1.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w2.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w2.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w2.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w3.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w3.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.feed_forward.w3.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.27.ffn_norm.weight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.28.attention.wo.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.28.attention.wo.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.28.attention.wo.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.28.attention.wqkv.qweight": "pytorch_model-00002-of-00003.bin",
+    "model.layers.28.attention.wqkv.qzeros": "pytorch_model-00002-of-00003.bin",
+    "model.layers.28.attention.wqkv.scales": "pytorch_model-00002-of-00003.bin",
+    "model.layers.28.attention_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w1.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w1.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w1.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w2.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w2.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w2.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w3.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w3.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.feed_forward.w3.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.28.ffn_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.attention.wo.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.attention.wo.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.attention.wo.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.attention.wqkv.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.attention.wqkv.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.attention.wqkv.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.attention_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w1.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w1.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w1.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w2.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w2.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w2.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w3.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w3.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.feed_forward.w3.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.29.ffn_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.3.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.3.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.30.attention.wo.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.attention.wo.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.attention.wo.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.attention.wqkv.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.attention.wqkv.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.attention.wqkv.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.attention_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w1.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w1.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w1.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w2.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w2.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w2.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w3.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w3.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.feed_forward.w3.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.30.ffn_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.attention.wo.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.attention.wo.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.attention.wo.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.attention.wqkv.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.attention.wqkv.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.attention.wqkv.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.attention_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w1.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w1.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w1.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w2.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w2.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w2.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w3.qweight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w3.qzeros": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.feed_forward.w3.scales": "pytorch_model-00003-of-00003.bin",
+    "model.layers.31.ffn_norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.layers.4.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.4.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.5.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.6.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.7.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.8.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.attention.wo.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.attention.wo.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.attention.wo.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.attention.wqkv.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.attention.wqkv.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.attention.wqkv.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.attention_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w1.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w1.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w1.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w2.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w2.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w2.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w3.qweight": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w3.qzeros": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.feed_forward.w3.scales": "pytorch_model-00001-of-00003.bin",
+    "model.layers.9.ffn_norm.weight": "pytorch_model-00001-of-00003.bin",
+    "model.norm.weight": "pytorch_model-00003-of-00003.bin",
+    "model.tok_embeddings.weight": "pytorch_model-00001-of-00003.bin",
+    "output.weight": "pytorch_model-00003-of-00003.bin"
+  }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>",
+    "<|action_start|>",
+    "<|action_end|>",
+    "<|interpreter|>",
+    "<|plugin|>"
+  ],
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f868398fc4e05ee1e8aeba95ddf18ddcc45b8bce55d5093bead5bbf80429b48b
+size 1477754

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,98 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "92538": {
+      "content": "<|plugin|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "92539": {
+      "content": "<|interpreter|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "92540": {
+      "content": "<|action_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "92541": {
+      "content": "<|action_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "92542": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "92543": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>",
+    "<|action_start|>",
+    "<|action_end|>",
+    "<|interpreter|>",
+    "<|plugin|>"
+  ],
+  "auto_map": {
+    "AutoTokenizer": [
+      "tokenization_internlm2.InternLM2Tokenizer",
+      null
+    ]
+  },
+  "bos_token": "<s>",
+  "chat_template": "{{ bos_token }}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "tokenizer_class": "InternLM2Tokenizer",
+  "unk_token": "<unk>"
+}