Upload folder using huggingface_hub (#1)

- c60e50ca7ee99bef1c725b52be2a0d4bd0229e6a2c6a466b2ffa0de41e91daf6 (8bfd12a150064d2f6775e63dfa0017ddb3d5d96a)
- 4f09e09ce6ab1eab17b5b587947cf1520ff5fb2c0123a1d5ca813a8ccadc11f7 (6e6121c08e34425cd7769b838a59ce7138fb24dd)
- 3c551d766f40ac84612dc99f3878d42cd01c864f9c42c67a90859037d218160e (76323d98ead7a2baae501d7ba5a8edb86f912129)
- 13c7867eeb5cde5ecf8878958929773e9a0cb31f1e654ba179442277cf0f4d92 (41bbf5470f04d3e06ad582ad4efe94f863a6ecd3)
- de6049638d35747844c25b6647ebee01a0b4c8d4c449a1835f642b62a347edd8 (158af34f87578316b44876b6ed4193424e595255)
- f800dabc9479dd59d9562769ce595fcac24c4064172e232478cd6c1aca592f80 (c7543e0f422f1ce87e95aedd1c28ef34236d4005)
- 25c183fe8c3736a0a0e65a3ae63596b8b7052abab300c83150b9cec80860d5ed (8ebb6bfbfd3f7a59772dd2a75e897ccf0c035c5d)
- 96d95a700940f663867fbbb8f1e34c6d401d72328427c28d23a1e6935c9b6e69 (1a448521523399ecca23373fe95886669119f29b)

Files changed (16) hide show

README.md ADDED Viewed

+---
+license: other
+tags:
+- generated_from_trainer
+- axolotl
+- mlx
+base_model: Qwen/Qwen1.5-110B
+datasets:
+- cognitivecomputations/Dolphin-2.9
+- teknium/OpenHermes-2.5
+- m-a-p/CodeFeedback-Filtered-Instruction
+- cognitivecomputations/dolphin-coder
+- cognitivecomputations/samantha-data
+- microsoft/orca-math-word-problems-200k
+- Locutusque/function-calling-chatml
+- internlm/Agent-FLAN
+---
+# mlx-community/dolphin-2.9.1-qwen-110b-2bit
+This model was converted to MLX format from [`cognitivecomputations/dolphin-2.9.1-qwen-110b`]() using mlx-lm version **0.12.1**.
+Refer to the [original model card](https://huggingface.co/cognitivecomputations/dolphin-2.9.1-qwen-110b) for more details on the model.
+## Use with mlx
+```bash
+pip install mlx-lm
+```
+```python
+from mlx_lm import load, generate
+model, tokenizer = load("mlx-community/dolphin-2.9.1-qwen-110b-2bit")
+response = generate(model, tokenizer, prompt="hello", verbose=True)
+```

added_tokens.json ADDED Viewed

+{
+  "<|endoftext|>": 151643,
+  "<|im_end|>": 151645,
+  "<|im_start|>": 151644
+}

config.json ADDED Viewed

+{
+    "architectures": [
+        "Qwen2ForCausalLM"
+    ],
+    "attention_dropout": 0.0,
+    "eos_token_id": 151645,
+    "hidden_act": "silu",
+    "hidden_size": 8192,
+    "initializer_range": 0.02,
+    "intermediate_size": 49152,
+    "max_position_embeddings": 32768,
+    "max_window_layers": 28,
+    "model_type": "qwen2",
+    "num_attention_heads": 64,
+    "num_hidden_layers": 80,
+    "num_key_value_heads": 8,
+    "quantization": {
+        "group_size": 64,
+        "bits": 2
+    },
+    "rms_norm_eps": 1e-06,
+    "rope_theta": 1000000.0,
+    "sliding_window": 32768,
+    "tie_word_embeddings": false,
+    "torch_dtype": "bfloat16",
+    "transformers_version": "4.40.0.dev0",
+    "use_cache": false,
+    "use_sliding_window": false,
+    "vocab_size": 152064
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model-00001-of-00007.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:999887f3368b003ec3714c5dc7d552071fc00668512980d9a672cb67ba9f3554
+size 5360175347

model-00002-of-00007.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0ad990e56f18bdac0827c72910dedf424ac498db78cbf75de79c6613dd755266
+size 5269824421

model-00003-of-00007.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:619bc3bf939ae29da1b55a8b01438a273754e10ed5b0de4df45b22ab65e734cd
+size 5348412800

model-00004-of-00007.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a63e6d0328e28ccb4e131796afb30f2428b8b1b19e1816e05b1bfccbc5f98ff1
+size 5269824423

model-00005-of-00007.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5b4131db87ef579a6d738694b6e1863f31af6fdb9c63dd13f652a54cb470b816
+size 5348412824

model-00006-of-00007.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d0b6fa815c68014851593fd382d52c49927a8b42d758d3c7a2445c9e33902ffc
+size 5269824455

model-00007-of-00007.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:951b4427d0c1e6aae815acda907c0c368501ec0e1bf869744675c60a9b87cb21
+size 2890469413

model.safetensors.index.json ADDED Viewed

The diff for this file is too large to render. See raw diff

special_tokens_map.json ADDED Viewed

+{
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>"
+  ],
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "151643": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151644": {
+      "content": "<|im_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "151645": {
+      "content": "<|im_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>"
+  ],
+  "bos_token": null,
+  "chat_template": "{% if not add_generation_prompt is defined %}{% set add_generation_prompt = false %}{% endif %}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "model_max_length": 32768,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff