Fluxi-IA

Sleeping

J-LAB commited on Jul 12, 2024

Commit

2617a01

verified ·

1 Parent(s): 53581ac

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ from PIL import Image
 import subprocess
 subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
-model_id = 'J-LAB/Florence_2_B_FluxiAI_Product_Caption'
 model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True).to("cuda").eval()
 processor = AutoProcessor.from_pretrained(model_id, trust_remote_code=True)
@@ -35,7 +35,7 @@ def run_example(task_prompt, image):
 def process_image(image, task_prompt):
     image = Image.fromarray(image)  # Convert NumPy array to PIL Image
     if task_prompt == 'Product Caption':
-        task_prompt = '<PC>'
     elif task_prompt == 'OCR':
         task_prompt = '<OCR>'

 import subprocess
 subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
+model_id = 'J-LAB/Florence_2_L_FluxiAI_Product_Caption'
 model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True).to("cuda").eval()
 processor = AutoProcessor.from_pretrained(model_id, trust_remote_code=True)
 def process_image(image, task_prompt):
     image = Image.fromarray(image)  # Convert NumPy array to PIL Image
     if task_prompt == 'Product Caption':
+        task_prompt = '<MORE_DETAILED_CAPTION>'
     elif task_prompt == 'OCR':
         task_prompt = '<OCR>'