Spaces:

allenai
/

reward-bench

Running

App Files Files Community

natolambert commited on Jan 21

Commit

8e499f4

•

1 Parent(s): e4cd4cd

add dataset viewer

Browse files

Files changed (1) hide show

app.py +23 -3

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import gradio as gr
 import os
 from huggingface_hub import HfApi, snapshot_download
 from src.utils import load_all_data
 from src.md import ABOUT_TEXT
 import numpy as np
@@ -10,6 +11,7 @@ api = HfApi()
 COLLAB_TOKEN = os.environ.get("COLLAB_TOKEN")
 evals_repo = "ai2-rlhf-collab/rm-benchmark-results"
 prefs_repo = "ai2-rlhf-collab/rm-testset-results"
 repo_dir_herm = "./evals/herm/"
 repo_dir_prefs = "./evals/prefs/"
@@ -27,7 +29,6 @@ repo = snapshot_download(
     etag_timeout=30,
     repo_type="dataset",
 )
-# repo.git_pull()
 repo_pref_sets = snapshot_download(
     local_dir=repo_dir_prefs,
@@ -37,7 +38,6 @@ repo_pref_sets = snapshot_download(
     etag_timeout=30,
     repo_type="dataset",
 )
-# repo_pref_sets.git_pull()
 def avg_over_herm(dataframe):
     """
@@ -69,6 +69,14 @@ col_types_herm_avg = ["markdown"] + ["number"] * (len(herm_data_avg.columns) - 1
 col_types_prefs = ["markdown"] + ["number"] * (len(prefs_data.columns) - 1)
 # col_types_prefs_sub = ["markdown"] + ["number"] * (len(prefs_data_sub.columns) - 1)
 with gr.Blocks() as app:
     # create tabs for the app, moving the current table to one titled "HERM" and the benchmark_text to a tab called "About"
     with gr.Row():
@@ -101,8 +109,20 @@ with gr.Blocks() as app:
         with gr.TabItem("About"):
             with gr.Row():
                 gr.Markdown(ABOUT_TEXT)
-# Load data when app starts
 def load_data_on_start():
     data_herm = load_all_data(repo_dir_herm)
     herm_table.update(data_herm)

 import gradio as gr
 import os
 from huggingface_hub import HfApi, snapshot_download
+from datasets import load_dataset
 from src.utils import load_all_data
 from src.md import ABOUT_TEXT
 import numpy as np
 COLLAB_TOKEN = os.environ.get("COLLAB_TOKEN")
 evals_repo = "ai2-rlhf-collab/rm-benchmark-results"
 prefs_repo = "ai2-rlhf-collab/rm-testset-results"
+eval_set_repo = "ai2-rlhf-collab/rm-benchmark-dev"
 repo_dir_herm = "./evals/herm/"
 repo_dir_prefs = "./evals/prefs/"
     etag_timeout=30,
     repo_type="dataset",
 )
 repo_pref_sets = snapshot_download(
     local_dir=repo_dir_prefs,
     etag_timeout=30,
     repo_type="dataset",
 )
 def avg_over_herm(dataframe):
     """
 col_types_prefs = ["markdown"] + ["number"] * (len(prefs_data.columns) - 1)
 # col_types_prefs_sub = ["markdown"] + ["number"] * (len(prefs_data_sub.columns) - 1)
+# for showing random samples
+eval_set = load_dataset(eval_set_repo, use_auth_token=COLLAB_TOKEN, split="filtered")
+def random_sample(r: gr.Request):
+    sample_index = np.random.randint(0, len(eval_set) - 1)
+    sample = eval_set[sample_index]
+    markdown_text = '\n\n'.join([f"**{key}**: {value}" for key, value in sample.items()])
+    return markdown_text
 with gr.Blocks() as app:
     # create tabs for the app, moving the current table to one titled "HERM" and the benchmark_text to a tab called "About"
     with gr.Row():
         with gr.TabItem("About"):
             with gr.Row():
                 gr.Markdown(ABOUT_TEXT)
+        with gr.TabItem("Dataset Viewer"):
+            with gr.Row():
+                # loads one sample
+                gr.Markdown("## Random Dataset Sample Viewer")
+                button = gr.Button("Show Random Sample")
+            with gr.Row():
+                sample_display = gr.Markdown("{sampled data loads here}")
+            button.click(fn=random_sample, outputs=sample_display)
+# Load data when app starts, TODO make this used somewhere...
 def load_data_on_start():
     data_herm = load_all_data(repo_dir_herm)
     herm_table.update(data_herm)