Spaces:

SeaEval
/

SeaEval_Leaderboard

Running

zhuohan-7 commited on 10 days ago

Commit

8f1beb0

•

1 Parent(s): 9155394

Upload folder using huggingface_hub

Files changed (2) hide show

app/draw_diagram.py CHANGED Viewed

@@ -65,17 +65,19 @@ def draw(folder_name, category_one, category_two, sort, num_sort, model_size_ran
     max_value = round(max(chart_data.iloc[:, 1]) + 0.1*max(chart_data.iloc[:, 1]), 1)
     display_names = {
-        'cross_mmlu'          : 'Cross-MMLU',
-        'cross_logiqa'        : 'Cross-LogiQA',
-        'cross_xquad'         : 'Cross-XQUAD',
-        'cross_mmlu_no_prompt': 'Cross-MMLU-No-Prompt',
-        'sg_eval'             : 'SG EVAL',
-        'sg_eval_v1_cleaned'  : 'SG EVAL V1 Cleaned',
-        'sg_eval_v2_mcq'      : 'SG EVAL V2 MCQ',
-        'sg_eval_v2_open'     : 'SG EVAL V2 Open Ended',
-        'us_eval'             : 'US EVAL',
-        'cn_eval'             : 'CN EVAL',
-        'ph_eval'             : 'PH EVAL'
     }
     data_columns = [i for i in chart_data.columns if i not in ['Model', 'model_show']]

     max_value = round(max(chart_data.iloc[:, 1]) + 0.1*max(chart_data.iloc[:, 1]), 1)
     display_names = {
+        'cross_mmlu'            : 'Cross-MMLU',
+        'cross_mmlu_no_prompt'  : 'Cross-MMLU-No-Prompt',
+        'cross_logiqa'          : 'Cross-LogiQA',
+        'cross_logiqa_no_prompt': 'Cross-LogiQA-No-Prompt',
+        'cross_xquad'           : 'Cross-XQUAD',
+        'cross_xquad_no_prompt' : 'Cross-XQUAD-No-Prompt',
+        'sg_eval'               : 'SG EVAL',
+        'sg_eval_v1_cleaned'    : 'SG EVAL V1 Cleaned',
+        'sg_eval_v2_mcq'        : 'SG EVAL V2 MCQ',
+        'sg_eval_v2_open'       : 'SG EVAL V2 Open Ended',
+        'us_eval'               : 'US EVAL',
+        'cn_eval'               : 'CN EVAL',
+        'ph_eval'               : 'PH EVAL'
     }
     data_columns = [i for i in chart_data.columns if i not in ['Model', 'model_show']]

app/pages.py CHANGED Viewed

@@ -78,9 +78,11 @@ def cross_lingual_consistency():
     filters_levelone = ['Zero Shot', 'Few Shot']
     filters_leveltwo = [
                         'Cross-MMLU',
                         'Cross-XQUAD',
                         'Cross-LogiQA',
-                        'Cross-MMLU-No-Prompt',
                         ]
     category_one_dict = {
@@ -89,10 +91,12 @@ def cross_lingual_consistency():
                          }
     category_two_dict = {
-                        'Cross-MMLU'  : 'cross_mmlu',
-                        'Cross-XQUAD' : 'cross_xquad',
-                        'Cross-LogiQA': 'cross_logiqa',
-                        'Cross-MMLU-No-Prompt': 'cross_mmlu_no_prompt'
                          }
     left, center, middle, _, right = st.columns([0.2, 0.2, 0.2, 0.2 ,0.2])

     filters_levelone = ['Zero Shot', 'Few Shot']
     filters_leveltwo = [
                         'Cross-MMLU',
+                        'Cross-MMLU-No-Prompt',
                         'Cross-XQUAD',
+                        'Cross-XQUAD-No-Prompt',
                         'Cross-LogiQA',
+                        'Cross-LogiQA-No-Prompt',
                         ]
     category_one_dict = {
                          }
     category_two_dict = {
+                        'Cross-MMLU'            : 'cross_mmlu',
+                        'Cross-MMLU-No-Prompt'  : 'cross_mmlu_no_prompt'
+                        'Cross-XQUAD'           : 'cross_xquad',
+                        'Cross-XQUAD-No-Prompt' : 'cross_xquad_no_prompt',
+                        'Cross-LogiQA'          : 'cross_logiqa',
+                        'Cross-LogiQA-No-Prompt': 'cross_logiqa_no_prompt',
                          }
     left, center, middle, _, right = st.columns([0.2, 0.2, 0.2, 0.2 ,0.2])