Upload folder using huggingface_hub

Browse files

Files changed (17) hide show

.gitattributes +2 -34
README.md +46 -0
chat_template.json +3 -0
config.json +54 -0
generation_config.json +6 -0
measurement.json +0 -0
model.safetensors.index.json +0 -0
output-00001-of-00005.safetensors +3 -0
output-00002-of-00005.safetensors +3 -0
output-00003-of-00005.safetensors +3 -0
output-00004-of-00005.safetensors +3 -0
output-00005-of-00005.safetensors +3 -0
preprocessor_config.json +27 -0
processor_config.json +7 -0
special_tokens_map.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +0 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,3 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

 *.safetensors filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text
+tokenizer.model filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,46 @@

+---
+language:
+- en
+- fr
+- de
+- es
+- it
+- pt
+- zh
+- ja
+- ru
+- ko
+license: other
+license_name: mrl
+base_model: mistralai/Pixtral-Large-Instruct-2411
+base_model_relation: quantized
+inference: false
+license_link: https://mistral.ai/licenses/MRL-0.1.md
+library_name: transformers
+pipeline_tag: image-text-to-text
+---
+# Pixtral-Large-Instruct-2411 🧡 ExLlamaV2 3.0bpw Quant
+3.0bpw quant of [Pixtral-Large-Instruct](https://huggingface.co/nintwentydo/Pixtral-Large-Instruct-2411).
+Vision inputs working on dev branch of [ExLlamaV2](https://github.com/turboderp/exllamav2/tree/dev).
+## Tokenizer And Prompt Template
+Using conversion of v7m1 tokenizer with 32k vocab size.
+Chat template in chat_template.json uses the v7 instruct template:
+```
+<s>[SYSTEM_PROMPT] <system prompt>[/SYSTEM_PROMPT][INST] <user message>[/INST] <assistant response></s>[INST] <user message>[/INST]
+```
+## Available Sizes
+| Repo | Bits | Head Bits | Size |
+| ----------- | ------ | ------ | ------ |
+| nintwentydo/Pixtral-Large-Instruct-2411-exl2-2.5bpw | 2.5 | 6.0 | TBC |
+| [nintwentydo/Pixtral-Large-Instruct-2411-exl2-3.0bpw](https://huggingface.co/nintwentydo/Pixtral-Large-Instruct-2411-exl2-3.0bpw) | 3.0 | 6.0 | 46.42 GB |
+| [nintwentydo/Pixtral-Large-Instruct-2411-exl2-4.0bpw](https://huggingface.co/nintwentydo/Pixtral-Large-Instruct-2411-exl2-4.0bpw) | 4.0 | 6.0 | 60.61GB |
+| nintwentydo/Pixtral-Large-Instruct-2411-exl2-5.0bpw | 5.0 | 6.0 | TBC |

chat_template.json ADDED Viewed

	@@ -0,0 +1,3 @@

+{
+    "chat_template": "{{- bos_token }}    \n{%- for message in messages %}    \n    {%- if message['role'] == 'user' %}    \n        {{- '[INST]' + ' ' }}    \n        {%- if message['content'] is not string %}    \n            {%- for chunk in message['content'] %}    \n                {%- if chunk['type'] == 'text' %}    \n                    {{- chunk['content'] }}    \n                {%- elif chunk['type'] == 'image' %}    \n                    {{- '[IMG]' }}    \n                {%- else %}    \n                    {{- raise_exception('Unrecognized content type!') }}    \n                {%- endif %}    \n            {%- endfor %}    \n                {%- else %}    \n                    {{- message['content'] }}    \n        {%- endif %}    \n            {{- '[\/INST]' }}    \n    {%- if not loop.last and messages[loop.index]['role'] == 'user' %}    \n        {{- eos_token }}    \n    {%- endif %}    \n    {%- elif message['role'] == 'system' %}    \n        {{- '[SYSTEM_PROMPT] ' + message['content'] + '[\/SYSTEM_PROMPT]' }}    \n    {%- elif message['role'] == 'assistant' %}    \n        {{- ' ' + message['content'] + eos_token }}    \n    {%- else %}    \n        {{- raise_exception('Only user, system and assistant roles are supported!') }}    \n    {%- endif %}    \n{%- endfor %}"
+}

config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+    "architectures": [
+        "LlavaForConditionalGeneration"
+    ],
+    "ignore_index": -100,
+    "image_seq_length": 1,
+    "image_token_index": 10,
+    "model_type": "llava",
+    "multimodal_projector_bias": false,
+    "projector_hidden_act": "gelu",
+    "text_config": {
+        "hidden_size": 12288,
+        "intermediate_size": 28672,
+        "is_composition": true,
+        "max_position_embeddings": 131072,
+        "model_type": "mistral",
+        "norm_eps": 1e-05,
+        "rms_norm_eps": 1e-05,
+        "num_attention_heads": 96,
+        "num_hidden_layers": 88,
+        "num_key_value_heads": 8,
+        "rope_theta": 1000000000,
+        "sliding_window": null,
+        "vocab_size": 32768
+    },
+    "torch_dtype": "bfloat16",
+    "transformers_version": "4.47.0.dev0",
+    "vision_config": {
+        "head_dim": 88,
+        "num_attention_heads": 16,
+        "hidden_act": "silu",
+        "hidden_size": 1408,
+        "image_size": 1024,
+        "image_token_id": 10,
+        "intermediate_size": 6144,
+        "model_type": "pixtral",
+        "num_hidden_layers": 40,
+        "patch_size": 16,
+        "rope_theta": 10000
+    },
+    "vision_feature_layer": -1,
+    "vision_feature_select_strategy": "full",
+    "quantization_config": {
+        "quant_method": "exl2",
+        "version": "0.2.6",
+        "bits": 3,
+        "head_bits": 6,
+        "calibration": {
+            "rows": 115,
+            "length": 2048,
+            "dataset": "(default)"
+        }
+    }
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "transformers_version": "4.48.0.dev0"
+}

measurement.json ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors.index.json ADDED Viewed

The diff for this file is too large to render. See raw diff

output-00001-of-00005.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ce514e144677e5e490ae7395574e9ac55bfc6c1c72e71161d3c1c558ea08f0e
+size 10694948492

output-00002-of-00005.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3dadb8fd8f1e4fb712869dd965559a58f2b89da9f759b05fc4310ff83ed3136d
+size 10675975442

output-00003-of-00005.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c39a6d58ffe34d456683b950d01dcb32d5e1d3ac2dcbc606807ee12f7e687b3
+size 10724636898

output-00004-of-00005.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7aedcc899763aeca2e5d9c031a81eeb85288e149f8b5cade4805208a69dccd3
+size 10732768956

output-00005-of-00005.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ae8a9e377f460a3a6bc114edafd52c81d29ee7f7e687bbd581462fca7ef30910
+size 7014876124

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "do_convert_rgb": true,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.48145466,
+    0.4578275,
+    0.40821073
+  ],
+  "image_processor_type": "PixtralImageProcessor",
+  "image_std": [
+    0.26862954,
+    0.26130258,
+    0.27577711
+  ],
+  "patch_size": {
+    "height": 16,
+    "width": 16
+  },
+  "processor_class": "PixtralProcessor",
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "longest_edge": 1024
+  }
+}

processor_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "image_break_token": "[IMG_BREAK]",
+  "image_end_token": "[IMG_END]",
+  "image_token": "[IMG]",
+  "patch_size": 16,
+  "processor_class": "PixtralProcessor"
+}

special_tokens_map.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1b968b8dc352f42192367337c78ccc61e1eaddc6d641a579372d4f20694beb7a
+size 587562

tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff