Spaces:

OpenGenAI
/

open-parti-prompts

Paused

App Files Files Community

patrickvonplaten commited on May 15, 2023

Commit

88fd33d

1 Parent(s): e82dda8

up

Browse files

Files changed (4) hide show

__pycache__/app.cpython-310.pyc +0 -0
app.py +205 -15
requirements.txt +1 -1
verify.py +18 -0

__pycache__/app.cpython-310.pyc ADDED Viewed

Binary file (6.4 kB). View file

app.py CHANGED Viewed

@@ -1,39 +1,77 @@
 from datasets import load_dataset
 from collections import Counter
-from random import choices, shuffle
 import os
 parti_prompt_results = []
 ORG = "diffusers-parti-prompts"
 SUBMISSIONS = {
-    "Stable Diffusion 1-5": load_dataset(os.path.join(ORG, "sd-v1-5"))["train"],
-    # "Stable Diffusion 2-1": load_dataset(os.path.join(ORG, "sd-v2-1")),
-    # "IF-1-0": None,
-    # "Karlo": None,
     # "Kadinsky":
 }
-NUM_QUESTIONS = 25
 submission_names = list(SUBMISSIONS.keys())
 num_images = len(SUBMISSIONS[submission_names[0]])
 def start():
     ids = {id: 0 for id in range(num_images)}
-    # submissions = load_dataset(os.path.join(ORG, "submissions"))
     # submitted_ids = Counter(submissions["ids"])
-    submitted_ids = {}
     ids = {**ids, **submitted_ids}
     # sort by count
-    ids = sorted(ids)
     # get lowest count ids
-    id_candidates = ids[:(8 * NUM_QUESTIONS)]
     # get random `NUM_QUESTIONS` ids to check
-    image_ids = choices(id_candidates, k=NUM_QUESTIONS)
     images = {}
     for i in range(NUM_QUESTIONS):
@@ -41,12 +79,164 @@ def start():
         shuffle(order)
         id = image_ids[i]
         images[i] = {
-            "prompt": SUBMISSIONS[submission_names[0]][id]["Prompt"],
             "id": id,
-            "choices": {i: SUBMISSIONS[submission_names[i]][id]["images"] for i in order},
         }
-    return images
-hello = start()

 from datasets import load_dataset
 from collections import Counter
+from random import sample, shuffle
+import datasets
+from pandas import DataFrame
+from huggingface_hub import list_datasets
 import os
+import gradio as gr
+import secrets
 parti_prompt_results = []
 ORG = "diffusers-parti-prompts"
 SUBMISSIONS = {
+    "sd-v1-5": load_dataset(os.path.join(ORG, "sd-v1-5"))["train"],
+    "sd-v2-1": load_dataset(os.path.join(ORG, "sd-v2.1"))["train"],
+    "if-v1-0": load_dataset(os.path.join(ORG, "karlo-v1"))["train"],
+    "karlo": load_dataset(os.path.join(ORG, "if-v-1.0"))["train"],
     # "Kadinsky":
 }
+NUM_QUESTIONS = 10
+MODEL_KEYS = "-".join(SUBMISSIONS.keys())
+SUBMISSION_ORG = f"results-{MODEL_KEYS}"
 submission_names = list(SUBMISSIONS.keys())
 num_images = len(SUBMISSIONS[submission_names[0]])
+def generate_random_hash(length=8):
+    """
+    Generates a random hash of specified length.
+    Args:
+        length (int): The length of the hash to generate.
+    Returns:
+        str: A random hash of specified length.
+    """
+    if length % 2 != 0:
+        raise ValueError("Length should be an even number.")
+    num_bytes = length // 2
+    random_bytes = secrets.token_bytes(num_bytes)
+    random_hash = secrets.token_hex(num_bytes)
+    return random_hash
 def start():
     ids = {id: 0 for id in range(num_images)}
     # submitted_ids = Counter(submissions["ids"])
+    all_datasets = list_datasets(author=SUBMISSION_ORG)
+    relevant_ids = [d.id for d in all_datasets]
+    submitted_ids = []
+    for _id in relevant_ids:
+        ds = load_dataset(_id)["train"]
+        submitted_ids += ds["id"]
+    submitted_ids = Counter(submitted_ids)
     ids = {**ids, **submitted_ids}
     # sort by count
+    ids = sorted(ids.items(), key=lambda x: x[1])
+    ids = [i[0] for i in ids]
     # get lowest count ids
+    id_candidates = ids[: (10 * NUM_QUESTIONS)]
     # get random `NUM_QUESTIONS` ids to check
+    image_ids = sample(id_candidates, k=NUM_QUESTIONS)
     images = {}
     for i in range(NUM_QUESTIONS):
         shuffle(order)
         id = image_ids[i]
+        row = SUBMISSIONS[submission_names[0]][id]
         images[i] = {
+            "prompt": row["Prompt"],
+            "result": "",
             "id": id,
+            "Challenge": row["Challenge"],
+            "Category": row["Category"],
+            "Note": row["Note"],
+        }
+        for n, m in enumerate(order):
+            images[i][f"choice_{n}"] = m
+    images_frame = DataFrame.from_dict(images, orient="index")
+    return images_frame
+def process(dataframe, row_number=0):
+    if row_number == NUM_QUESTIONS:
+        return None, ""
+    image_id = dataframe.iloc[row_number]["id"]
+    choices = [
+        submission_names[dataframe.iloc[row_number][f"choice_{i}"]]
+        for i in range(len(SUBMISSIONS))
+    ]
+    images = [SUBMISSIONS[c][int(image_id)]["images"] for c in choices]
+    prompt = SUBMISSIONS[choices[0]][int(image_id)]["Prompt"]
+    prompt = f"Prompt {row_number + 1}/{NUM_QUESTIONS}: '{prompt}'"
+    return images, prompt
+def write_result(user_choice, row_number, dataframe, prompt):
+    if row_number == NUM_QUESTIONS:
+        return row_number, dataframe
+    user_choice = int(user_choice)
+    chosen_model = submission_names[dataframe.iloc[row_number][f"choice_{user_choice}"]]
+    dataframe.loc[row_number, "result"] = chosen_model
+    return row_number + 1, dataframe
+def get_index(evt: gr.SelectData) -> int:
+    return evt.index
+def change_view(row_number, dataframe):
+    if row_number == NUM_QUESTIONS:
+        favorite_model = dataframe["result"].value_counts().idxmax()
+        dataset = datasets.Dataset.from_pandas(dataframe)
+        dataset = dataset.remove_columns(set(dataset.column_names) - set(["id", "result"]))
+        hash = generate_random_hash()
+        repo_id = os.path.join(SUBMISSION_ORG, hash)
+        dataset.push_to_hub(repo_id, token=os.getenv("HF_TOKEN"))
+        return {
+            result: f"You are of type: {favorite_model}!",
+            result_view: gr.update(visible=True),
+            gallery_view: gr.update(visible=False),
+        }
+    else:
+        return {
+            result: "",
+            result_view: gr.update(visible=False),
+            gallery_view: gr.update(visible=True),
         }
+if True:
+    TITLE = "Open-Source Parti Prompts"
+    DESCRIPTION = "An interactive 'Which Generative AI' game to evaluate open-source generative AI models"
+    GALLERY_COLUMN_NUM = len(SUBMISSIONS)
+    with gr.Blocks(css="style.css") as demo:
+        gr.Markdown(TITLE)
+        gr.Markdown(DESCRIPTION)
+        start_button = gr.Button("Start").style(full_width=False)
+        headers = ["prompt", "result", "id", "Challenge", "Category", "Note"] + [
+            f"choice_{i}" for i in range(len(SUBMISSIONS))
+        ]
+        datatype = ["str", "str", "number", "str", "str", "str"] + len(SUBMISSIONS) * [
+            "number"
+        ]
+        with gr.Column(visible=False):
+            row_number = gr.Number(
+                label="Current row selection index",
+                value=0,
+                precision=0,
+                interactive=False,
+            )
+        # Create Data Frame
+        with gr.Column(visible=False) as result_view:
+            result = gr.Markdown("")
+            dataframe = gr.Dataframe(
+                headers=headers,
+                datatype=datatype,
+                row_count=NUM_QUESTIONS,
+                col_count=(6 + len(SUBMISSIONS), "fixed"),
+                interactive=False,
+            )
+            gr.Markdown("Click on start to play again!")
+        with gr.Column(visible=True) as gallery_view:
+            gr.Markdown("Pick your the photo that best corresponds to the prompt.")
+            prompt = gr.Markdown(f"Prompt 1/{NUM_QUESTIONS}: ")
+            gallery = gr.Gallery(
+                label="All images", show_label=False, elem_id="gallery"
+            ).style(columns=GALLERY_COLUMN_NUM, object_fit="contain")
+            next_button = gr.Button("Select").style(full_width=False)
+        with gr.Column(visible=False):
+            selected_image = gr.Number(label="Selected index", value=-1, precision=0)
+        start_button.click(
+            fn=start,
+            inputs=[],
+            outputs=dataframe
+        ).then(
+            fn=lambda x: 0 if x == NUM_QUESTIONS else x,
+            inputs=[row_number],
+            outputs=[row_number],
+        ).then(
+            fn=change_view,
+            inputs=[row_number, dataframe],
+            outputs=[result_view, gallery_view, result]
+        ).then(
+            fn=process, inputs=[dataframe], outputs=[gallery, prompt]
+        )
+        gallery.select(
+            fn=get_index,
+            outputs=selected_image,
+            queue=False,
+        )
+        next_button.click(
+            fn=write_result,
+            inputs=[selected_image, row_number, dataframe, prompt],
+            outputs=[row_number, dataframe],
+        ).then(
+            fn=process,
+            inputs=[dataframe, row_number],
+            outputs=[gallery, prompt]
+        ).then(
+            fn=change_view,
+            inputs=[row_number, dataframe],
+            outputs=[result_view, gallery_view, result]
+        ).then(
+            fn=lambda x: 0 if x == NUM_QUESTIONS else x,
+            inputs=[row_number],
+            outputs=[row_number],
+        )
+    demo.launch()

requirements.txt CHANGED Viewed

@@ -1,2 +1,2 @@
-requests
 datasets



1	datasets
2	+ pandas

verify.py ADDED Viewed

	@@ -0,0 +1,18 @@

+#!/usr/bin/env python3
+from datasets import load_dataset
+from collections import Counter
+from random import choices, shuffle
+from pandas import DataFrame
+import os
+import gradio as gr
+parti_prompt_results = []
+ORG = "diffusers-parti-prompts"
+SUBMISSIONS = {
+    "sd_v1_5": load_dataset(os.path.join(ORG, "sd-v1-5"))["train"],
+    "sd_v2_1": load_dataset(os.path.join(ORG, "sd-v2.1"))["train"],
+    "if_v1_0": load_dataset(os.path.join(ORG, "karlo-v1"))["train"],
+    "karlo": load_dataset(os.path.join(ORG, "if-v-1.0"))["train"],
+    # "Kadinsky":
+}
+import ipdb; ipdb.set_trace()