de-arena

Sleeping

yzabc007 commited on Oct 7

Commit

2642851

•

1 Parent(s): 428cea6

Update space

Files changed (2) hide show

app.py CHANGED Viewed

@@ -97,6 +97,25 @@ def init_leaderboard(dataframe):
     )
 demo = gr.Blocks(css=custom_css)
 with demo:
     gr.HTML(TITLE)
@@ -104,7 +123,7 @@ with demo:
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 Overall", elem_id="llm-benchmark-tab-table", id=0):
-            leaderboard = init_leaderboard(LEADERBOARD_DF)
         with gr.TabItem("🔢 Math", elem_id="math-tab-table", id=1):

     )
+def overall_leaderboard(dataframe):
+    if dataframe is None or dataframe.empty:
+        raise ValueError("Leaderboard DataFrame is empty or None.")
+    return Leaderboard(
+        value=dataframe,
+        datatype=[c.type for c in fields(AutoEvalColumn)],
+        select_columns=None,
+        search_columns=SearchColumns(primary_column=AutoEvalColumn.model.name, secondary_columns=[],
+                                     placeholder="Search by the model name",
+                                     label="Searching"),
+        hide_columns=[c.name for c in fields(AutoEvalColumn) if c.hidden],
+        filter_columns=None,
+        interactive=False,
+    )
 demo = gr.Blocks(css=custom_css)
 with demo:
     gr.HTML(TITLE)
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 Overall", elem_id="llm-benchmark-tab-table", id=0):
+            leaderboard = overall_leaderboard(LEADERBOARD_DF)
         with gr.TabItem("🔢 Math", elem_id="math-tab-table", id=1):

src/leaderboard/read_evals.py CHANGED Viewed

@@ -194,3 +194,4 @@ def get_raw_eval_results(results_path: str, requests_path: str) -> list[EvalResu
             continue
     return results