Spaces:

asahi417
/

CLIP-Interrogator

Running on Zero

App Files Files Community

asahi417 commited on Jul 30, 2024

Commit

3bd9346

verified ·

1 Parent(s): 377ebdf

Upload folder using huggingface_hub

Browse files

Files changed (3) hide show

README.md +2 -2
app.py +7 -28
requirements.txt +1 -0

README.md CHANGED Viewed

@@ -1,8 +1,8 @@
 ---
 title: CLIP Interrogator
 emoji: 🕵️‍♂️
-colorFrom: green
-colorTo: purple
 sdk: gradio
 sdk_version: 4.8.0
 app_file: app.py

 ---
 title: CLIP Interrogator
 emoji: 🕵️‍♂️
+colorFrom: blue
+colorTo: red
 sdk: gradio
 sdk_version: 4.8.0
 app_file: app.py

app.py CHANGED Viewed

@@ -1,16 +1,8 @@
 import spaces
-import torch
 import gradio as gr
-from clip_interrogator import Config, Interrogator
-config = Config()
-config.device = 'cuda' if torch.cuda.is_available() else 'cpu'
-config.blip_offload = False if torch.cuda.is_available() else True
-config.chunk_size = 2048
-config.flavor_intermediate_count = 512
-config.blip_num_beams = 64
-ci = Interrogator(config)
 css = """
 #col-container {
     margin: 0 auto;
@@ -20,31 +12,18 @@ css = """
 @spaces.GPU
-def infer(image, mode, best_max_flavors):
     image = image.convert('RGB')
-    if mode == 'best':
-        prompt_result = ci.interrogate(image, max_flavors=int(best_max_flavors))
-    elif mode == 'classic':
-        prompt_result = ci.interrogate_classic(image)
-    else:
-        prompt_result = ci.interrogate_fast(image)
-    return prompt_result
 with gr.Blocks(css=css) as demo:
     with gr.Column(elem_id="col-container"):
         gr.Markdown("# CLIP Interrogator")
-        input_image = gr.Image(type='pil', elem_id="input-img")
         with gr.Row():
-            mode_input = gr.Radio(['best', 'classic', 'fast'], label='Select mode', value='best')
             flavor_input = gr.Slider(minimum=2, maximum=48, step=2, value=32, label='best mode max flavors')
         run_button = gr.Button("Submit")
         output_text = gr.Textbox(label="Description Output")
-    run_button.click(
-        fn=infer,
-        inputs=[input_image, mode_input, flavor_input],
-        outputs=[output_text],
-        concurrency_limit=10
-    )
-demo.queue().launch()

 import spaces
 import gradio as gr
+from panna import CLIPInterrogator
+model = CLIPInterrogator()
 css = """
 #col-container {
     margin: 0 auto;
 @spaces.GPU
+def infer(image, best_max_flavors):
     image = image.convert('RGB')
+    return model.image2text([image], best_max_flavors=best_max_flavors)[0]
 with gr.Blocks(css=css) as demo:
     with gr.Column(elem_id="col-container"):
         gr.Markdown("# CLIP Interrogator")
+        input_image = gr.Image(type='pil')
         with gr.Row():
             flavor_input = gr.Slider(minimum=2, maximum=48, step=2, value=32, label='best mode max flavors')
         run_button = gr.Button("Submit")
         output_text = gr.Textbox(label="Description Output")
+    run_button.click(fn=infer, inputs=[input_image, flavor_input], outputs=[output_text], concurrency_limit=10)
+demo.launch()

requirements.txt CHANGED Viewed

@@ -3,3 +3,4 @@ torch
 torchvision
 spaces
 clip-interrogator

 torchvision
 spaces
 clip-interrogator
+panna