Spaces:

mery22
/

testing

Sleeping

mery22 commited on May 16

Commit

c63fc8e

•

1 Parent(s): b1c7ee7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -31,38 +31,12 @@ model_config = transformers.AutoConfig.from_pretrained(
 tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 tokenizer.pad_token = tokenizer.eos_token
 tokenizer.padding_side = "right"
-#################################################################
-# bitsandbytes parameters
-#################################################################
-# Activate 4-bit precision base model loading
-use_4bit = True
-# Compute dtype for 4-bit base models
-bnb_4bit_compute_dtype = "float16"
-# Quantization type (fp4 or nf4)
-bnb_4bit_quant_type = "nf4"
-# Activate nested quantization for 4-bit base models (double quantization)
-use_nested_quant = False
-#################################################################
-# Set up quantization config
-#################################################################
-compute_dtype = getattr(torch, bnb_4bit_compute_dtype)
-bnb_config = BitsAndBytesConfig(
-    load_in_4bit=use_4bit,
-    bnb_4bit_quant_type=bnb_4bit_quant_type,
-    bnb_4bit_compute_dtype=compute_dtype,
-    bnb_4bit_use_double_quant=use_nested_quant,
-)
 #############################################################
 # Load pre-trained config
 #################################################################
 model = AutoModelForCausalLM.from_pretrained(
-   "mistralai/Mistral-7B-Instruct-v0.1",
-    quantization_config=bnb_config,
 )
 # Connect query to FAISS index using a retriever
 retriever = db.as_retriever(

 tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 tokenizer.pad_token = tokenizer.eos_token
 tokenizer.padding_side = "right"
 #############################################################
 # Load pre-trained config
 #################################################################
 model = AutoModelForCausalLM.from_pretrained(
+   "mistralai/Mistral-7B-Instruct-v0.1"
 )
 # Connect query to FAISS index using a retriever
 retriever = db.as_retriever(