onekq-ai
/

starcoder2-15b-bnb-4bit

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

onekq commited on Oct 18

Commit

418f6d7

•

1 Parent(s): 9b20989

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -10,7 +10,7 @@ Bitsandbytes quantization of https://huggingface.co/bigcode/starcoder2-15b.
 See https://huggingface.co/blog/4bit-transformers-bitsandbytes for instructions.
 ```python
-from transformers import AutoModelForCausalLM
 from transformers import BitsAndBytesConfig
 import torch
@@ -21,5 +21,8 @@ nf4_config = BitsAndBytesConfig(
    bnb_4bit_compute_dtype=torch.bfloat16
 )
 model = AutoModelForCausalLM.from_pretrained("bigcode/starcoder2-15b", quantization_config=nf4_config)
 model.push_to_hub("onekq-ai/starcoder2-15b-bnb-4bit")
 ```

 See https://huggingface.co/blog/4bit-transformers-bitsandbytes for instructions.
 ```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
 from transformers import BitsAndBytesConfig
 import torch
    bnb_4bit_compute_dtype=torch.bfloat16
 )
 model = AutoModelForCausalLM.from_pretrained("bigcode/starcoder2-15b", quantization_config=nf4_config)
+tokenizer = AutoTokenizer.from_pretrained("bigcode/starcoder2-15b")
 model.push_to_hub("onekq-ai/starcoder2-15b-bnb-4bit")
+tokenizer.push_to_hub("onekq-ai/starcoder2-15b-bnb-4bit")
 ```