Spaces:

chen196473
/

amazon-multimodal-product-assistant

Build error

App Files Files Community

Wisdom Chen commited on Dec 11, 2024

Commit

6740c9f

unverified ·

1 Parent(s): 3844cc6

Update model.py

Browse files

Files changed (1) hide show

model.py +20 -8

model.py CHANGED Viewed

@@ -51,17 +51,31 @@ def initialize_models() -> bool:
     global clip_model, clip_preprocess, clip_tokenizer, llm_tokenizer, llm_model, device
     try:
-        # CLIP initialization remains the same...
         # Initialize LLM with optimized settings
         try:
             model_name = "mistralai/Mistral-7B-v0.1"
             quantization_config = BitsAndBytesConfig(
                 load_in_4bit=True,
-                bnb_4bit_quant_type="nf4",
-                bnb_4bit_use_double_quant=True
             )
             hf_token = st.secrets.get("HUGGINGFACE_TOKEN")
             if not hf_token:
                 raise ValueError("HUGGINGFACE_TOKEN not found in Streamlit secrets")
@@ -70,19 +84,17 @@ def initialize_models() -> bool:
             llm_tokenizer = AutoTokenizer.from_pretrained(
                 model_name,
                 token=hf_token,
-                trust_remote_code=True,
-                revision="v0.1"
             )
             llm_tokenizer.pad_token = llm_tokenizer.eos_token
             llm_model = AutoModelForCausalLM.from_pretrained(
                 model_name,
                 token=hf_token,
                 quantization_config=quantization_config,
                 device_map="auto",
                 torch_dtype=torch.float16,
-                trust_remote_code=True,
-                revision="v0.1"
             )
             llm_model.eval()
             print("LLM initialized successfully")

     global clip_model, clip_preprocess, clip_tokenizer, llm_tokenizer, llm_model, device
     try:
+        print(f"Initializing models on device: {device}")
+        # Initialize CLIP model with error handling
+        try:
+            clip_model, _, clip_preprocess = open_clip.create_model_and_transforms(
+                'hf-hub:Marqo/marqo-fashionCLIP'
+            )
+            clip_model = clip_model.to(device)
+            clip_model.eval()
+            clip_tokenizer = open_clip.get_tokenizer('hf-hub:Marqo/marqo-fashionCLIP')
+            print("CLIP model initialized successfully")
+        except Exception as e:
+            raise RuntimeError(f"Failed to initialize CLIP model: {str(e)}")
         # Initialize LLM with optimized settings
         try:
             model_name = "mistralai/Mistral-7B-v0.1"
             quantization_config = BitsAndBytesConfig(
                 load_in_4bit=True,
+                bnb_4bit_compute_dtype=torch.float16,
+                bnb_4bit_use_double_quant=True,
+                bnb_4bit_quant_type="nf4"
             )
+            # Get token from Streamlit secrets
             hf_token = st.secrets.get("HUGGINGFACE_TOKEN")
             if not hf_token:
                 raise ValueError("HUGGINGFACE_TOKEN not found in Streamlit secrets")
             llm_tokenizer = AutoTokenizer.from_pretrained(
                 model_name,
                 token=hf_token,
+                trust_remote_code=True
             )
             llm_tokenizer.pad_token = llm_tokenizer.eos_token
             llm_model = AutoModelForCausalLM.from_pretrained(
                 model_name,
                 token=hf_token,
                 quantization_config=quantization_config,
                 device_map="auto",
                 torch_dtype=torch.float16,
+                trust_remote_code=True
             )
             llm_model.eval()
             print("LLM initialized successfully")